[发明专利]高表现力的语音合成方法和装置有效

申请号：	201410645715.2	申请日：	2014-11-12
公开（公告）号：	CN104392716B	公开（公告）日：	2017-10-13
发明（设计）人：	李秀林;贾磊;康永国	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L13/027	分类号：	G10L13/027;G10L13/08
代理公司：	北京品源专利代理有限公司11332	代理人：	孟金喆
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例公开了一种高表现力的语音合成方法和装置。所述高表现力的语音合成方法包括将输入文本进行处理分析，得到所述输入文本对应的音子序列以及所述音子序列中音子包含的状态的上下文；根据所述状态的上下文，基于维特比算法从所述状态对应的包含至少两个高斯声学模型的高斯混合声学模型中选择一个高斯声学模型，作为合成语音的高斯声学模型；根据所选择的高斯声学模型生成声学参数，并根据生成的声学参数合成语音，包括利用声码器将声学参数来合成语音或者用声学参数指导声学片段的单元挑选来生成语音。本发明实施例提供的高表现力的语音合成方法和装置提高了合成语音的自然度。
搜索关键词：	表现力语音合成方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种高表现力的语音合成方法，其特征在于，包括：训练用于获取语料库中不同上下文对应的高斯混合声学模型的决策树；对语料库中不同上下文的音子序列中音子包含的状态的语音进行统计，获取语料库中不同上下文的音子序列中音子包含的状态对应的高斯混合声学模型中包含的高斯声学模型的均值、方差以及对应的加权值，将统计得到的均值、方差以及加权值作为所述高斯混合声学模型的参数，生成所述高斯混合声学模型；统计在不同上下文中所述高斯混合声学模型中各个高斯声学模型之间的转移概率；将输入文本进行处理分析，得到所述输入文本对应的音子序列以及所述音子序列中音子包含的状态的上下文；根据所述决策树，获取所述状态的上下文中所述状态对应的高斯混合声学模型，所述高斯混合声学模型包含至少两个分量，每一个分量相互独立并服从高斯分布，每一个分量是一个独立的高斯声学模型，将所述高斯混合声学模型中包含的高斯声学模型的加权值作为节点度量，将所述高斯声学模型之间的转移概率作为路径度量，通过求和计算状态序列的不同路径的度量值，将所述度量值最大的一条路径作为所述状态序列的最佳路径，通过路径回溯选取所述状态序列中各个状态对应的高斯声学模型；根据所选择的高斯声学模型生成声学参数，并根据生成的声学参数合成语音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410645715.2/，转载请声明来源钻瓜专利网。

上一篇：西数3.5寸硬盘平推式底层通信设备及其底层通信方法
下一篇：一种环形多面显示器件

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]高表现力的语音合成方法和装置有效

专利文献下载