[发明专利]语音合成方法及系统有效

申请号：	201510305764.6	申请日：	2015-06-04
公开（公告）号：	CN106297766B	公开（公告）日：	2019-11-15
发明（设计）人：	夏咸军;江源;王影;胡国平;胡郁;刘庆峰	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L13/10	分类号：	G10L13/10;G10L13/08;G10L25/69;G10L25/03
代理公司：	11252 北京维澳专利代理有限公司	代理人：	刘路尧;逢京喜<国际申请>=<国际公布>
地址：	230088安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种语音合成方法及系统，该方法包括：接收待合成文本；对所述待合成文本进行预处理，得到所述待合成文本的待合成单元序列及待合成单元的上下文相关信息；根据所述待合成单元的上下文相关信息从音库中获取所述待合成单元序列的最优备选语音数据；获取测听人员对所述备选语音数据的测听结果；根据所述测听结果对所述音库进行扩充；利用扩充后的音库重新获取所述待合成单元序列的最优备选语音数据，并将重新获取的最优备选语音数据作为优化后的语音数据；将所述优化后的语音数据作为所述待合成文本的合成语音数据输出。利用本发明，可以准确地将人工主观听感融合到待合成文本的合成结果中，提升语音合成效果。
搜索关键词：	语音合成方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音合成方法，其特征在于，包括以下步骤：/n(1)接收待合成文本；/n(2)对所述待合成文本进行预处理，得到所述待合成文本的待合成单元序列及待合成单元的上下文相关信息；/n(3)根据所述待合成单元的上下文相关信息从音库中获取所述待合成单元序列的最优备选语音数据；/n(4)获取测听人员对所述最优备选语音数据的测听结果；/n(5)根据所述测听结果对所述音库进行扩充；/n(6)利用扩充后的音库重新获取所述待合成单元序列的最优备选语音数据，并将重新获取的最优备选语音数据作为优化后的语音数据；/n(7)将所述优化后的语音数据作为所述待合成文本的合成语音数据输出。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司，未经科大讯飞股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510305764.6/，转载请声明来源钻瓜专利网。

同类专利

一种韵律预测方法及装置-201911088396.9
发明人：王昆 -专利权人：四川长虹电器股份有限公司
申请日： 2019-11-08 - 公布日： 2020-02-07 - 主分类号： G10L13/10
摘要：本发明涉及语音合成技术，其公开了一种韵律预测方法及装置，提升韵律预测准确率，从而提升语音合成系统前端的性能，以提升语音合成质量。本发明中的韵律预测方法包括：提取待处理文本的综合语言学特征；将提取的综合语言学特征输入已训练的韵律预测模型中，输出韵律标记信息。本发明充分利用待预测句子的分词及标点信息，采用分层预测模型的方法，提升了韵律预测模型的准确率，对语音合成前端系统有明显增强，可显著提升合成语音的韵律感和语音质量。

基于人工智能韵律预测的样本标注方法及装置-201611135605.7
发明人：徐扬凯;康永国;彭一平 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2016-12-09 - 公布日： 2020-02-04 - 主分类号： G10L13/10
摘要：本发明提出一种基于人工智能韵律预测的样本标注方法及装置，其中，方法包括：获取与第一样本音频文件对应的未标注韵律的第一文本序列；获取第一文本序列中每个字的文本特征和发音时长；应用预先训练的韵律标注模型对第一文本序列中每个字的文本特征和发音时长，获取第一文本序列中每个字的输出标记；根据第一文本序列中每个字的输出标记对第一文本序列进行韵律层级标注。由此，降低了文本的标注成本，提高了文本的标注效率和准确性，并能够提供更多的韵律层级标注所需的训练样本，提高韵律标注模型性能，使得语音合成效果更加自然。

基于音频的人机混合交互系统及方法-201610791966.0
发明人：俞凯;石开宇;郑达;陈露;常成;曹迪 -专利权人：上海交通大学
申请日： 2016-08-31 - 公布日： 2020-01-10 - 主分类号： G10L13/10
摘要：本发明公开了一种基于音频的人机混合交互系统，语音识别模块与语义识别模块相连并传输语音对应的文字信息，异常处理模块与语音识别模块和语义识别模块相连，语音识别模块传输文字信息给异常处理模块，语义识别模块传输语义解析结果给异常处理模块；异常处理模块与语音合成模块相连并传输干预信息。本发明还公开了一种基于音频的人机混合交互方法，语音识别模块将语音信息转换为文字信息并输出至语义识别单元；语义识别单元从文字信息中提取用户目的以及相应的关键信息；异常处理模块根据语音识别模块的文字信息以及语义识别模块的语义信息判断人机对话当前是否出现异常并针对异常处理消息的回复。本发明的技术方案提供统一的人机对话体验。

自动选择伴奏的方法和装置-201610065562.3
发明人：袁晓晶 -专利权人：北京精奇互动科技有限公司
申请日： 2016-01-29 - 公布日： 2019-12-03 - 主分类号： G10L13/10
摘要：本发明公开了一种自动选择伴奏的方法和装置，该方法包括：根据采集到的用户哼唱的旋律生成预设格式的第一音频文件，其次根据第一音频文件确定用户哼唱的速度，然后将第一音频文件转换为MIDI格式的第二音频文件，并对第二音频文件进行去高音处理，得到MIDI格式的第三音频文件，然后确定第三音频文件的调号，并根据第三音频文件和速度确定第三音频文件的小节起点位置，从而根据第三音频文件、调号以及小节起点位置确定第三音频文件的和弦走向，进而根据第三音频文件、速度、调号、小节起点位置以及和弦走向选择伴奏。能够根据用户哼唱的旋律自动选择伴奏，简化了配伴奏操作，使非专业人士不需要学习乐理知识也能够为哼唱旋律配伴奏。

语音合成方法和装置-201810410481.1
发明人：李昊;康永国;王振宇 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2018-05-02 - 公布日： 2019-11-26 - 主分类号： G10L13/10
摘要：本发明实施例提供一种语音合成方法和装置。该方法包括：获取待处理文本的音素特征和韵律及情感特征，根据音素特征和韵律及情感特征，采用预先训练的时长模型，确定待处理文本的语音时长，所述时长模型基于卷积神经网络训练得到，根据音素特征、韵律及情感特征和语音时长，采用预先训练的声学参数模型，确定待处理文本的声学特征参数，所述声学参数模型基于卷积神经网络训练得到，根据声学特征参数，合成待处理文本的语音。本发明实施例的方法，能够在满足实时性要求的前提下，提供音质更高，更加具有情感表现力，更加自然流畅的合成语音。

语音合成方法及系统-201510305764.6
发明人：夏咸军;江源;王影;胡国平;胡郁;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2015-06-04 - 公布日： 2019-11-15 - 主分类号： G10L13/10
摘要：本发明公开了一种语音合成方法及系统，该方法包括：接收待合成文本；对所述待合成文本进行预处理，得到所述待合成文本的待合成单元序列及待合成单元的上下文相关信息；根据所述待合成单元的上下文相关信息从音库中获取所述待合成单元序列的最优备选语音数据；获取测听人员对所述备选语音数据的测听结果；根据所述测听结果对所述音库进行扩充；利用扩充后的音库重新获取所述待合成单元序列的最优备选语音数据，并将重新获取的最优备选语音数据作为优化后的语音数据；将所述优化后的语音数据作为所述待合成文本的合成语音数据输出。利用本发明，可以准确地将人工主观听感融合到待合成文本的合成结果中，提升语音合成效果。

一种语音合成方法及系统-201510039232.2
发明人：祖漪清;王祖燕;黄维;邵鹏飞;胡国平;胡郁;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2015-01-26 - 公布日： 2019-11-15 - 主分类号： G10L13/10
摘要：本发明公开了一种语音合成方法及系统，该方法包括：接收待合成文本；确定对应所述文本的基本合成单元序列，所述基本合成单元序列包括一个或多个基本合成单元；确定各基本合成单元是否弱读；依次提取所述基本合成单元序列中各基本合成单元的韵律特征，并且如果所述基本合成单元为弱读，则所述基本合成单元的韵律特征包括弱读特征；根据所述基本合成单元的韵律特征确定所述基本合成单元对应的合成参数模型或语音片断，得到对应所述基本合成单元序列的合成参数模型序列或语音片断序列；根据所述合成参数模型序列生成连续语音，或拼接所述语音片断序列中的语音片断得到连续语音。利用本发明，可以简单有效地提高连续合成语音的自然度。

提高合成语音韵律自然度的方法及系统-201510038454.2
发明人：祖漪清;王祖燕;黄维;邵鹏飞;胡国平;胡郁;刘庆峰 -专利权人：科大讯飞股份有限公司
申请日： 2015-01-26 - 公布日： 2019-11-15 - 主分类号： G10L13/10
摘要：本发明公开了一种提高合成语音韵律自然度的方法及系统，该方法包括：接收待合成文本；确定对应所述文本的基本合成单元序列，所述基本合成单元序列包括一个或多个基本合成单元；确定各基本合成单元是否弱读；获取所述基本合成单元对应的合成参数模型，并且如果所述基本合成单元为弱读，则对所述基本合成单元对应的合成参数模型进行弱读化处理，得到更新的合成参数模型；生成对应所述基本合成单元序列的合成参数模型序列；根据所述合成参数模型序列生成连续语音。利用本发明，可以简单有效地提高连续合成语音的自然度。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音合成方法及系统有效

专利文献下载