[发明专利]一种语音合成播放方法、装置和存储介质在审

申请号：	201910848598.2	申请日：	2019-09-09
公开（公告）号：	CN110600004A	公开（公告）日：	2019-12-20
发明（设计）人：	杨木文	申请（专利权）人：	腾讯科技(深圳)有限公司
主分类号：	G10L13/08	分类号：	G10L13/08
代理公司：	44300 深圳翼盛智成知识产权事务所(普通合伙)	代理人：	汪阮磊
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例公开了一种语音合成播放方法、装置和存储介质，其中，用户终端可以接收语音合成请求，并根据语音合成请求获取需要进行语音合成的待合成文本，然后将待合成文本发送至语音合成服务器进行语音合成，得到对应的合成语音，然后播放该合成语音，并接收对合成语音的发音校正请求，根据发音校正请求接收对应于合成语音的校正数据，将该校正数据发送至语音合成服务器用于更新合成语音，从而得到更新后的合成语音，将当前播放的合成语音替换为更新后的合成语音进行播放。相比于相关技术，本发明在播放合成语音的过程中，能够实时对播放的合成语音进行校正、更新，由此，即使在多音字的发音预测错误时，也能够及时校正其发音。
搜索关键词：	语音合成语音合成播放语音合成服务器发音校正合成文本校正发音更新多音字发送存储介质更新合成请求获取请求接收校正数据用户终端语音替换正数据预测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音合成播放方法，其特征在于，包括：/n接收语音合成请求，并根据所述语音合成请求获取需要进行语音合成的待合成文本；/n将所述待合成文本发送至语音合成服务器进行语音合成，使得所述语音合成服务器返回对应所述待合成文本的合成语音；/n播放所述合成语音，并接收对所述合成语音的发音校正请求；/n根据所述发音校正请求接收输入的对应于所述合成语音的校正数据，并将所述校正数据发送至所述语音合成服务器，使得所述语音合成服务器根据所述校正数据更新所述合成语音，并返回更新后的合成语音；/n将当前播放的所述合成语音替换为所述更新后的合成语音进行播放。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司，未经腾讯科技(深圳)有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910848598.2/，转载请声明来源钻瓜专利网。

上一篇：机器人的语音输出方法、装置、机器人和存储介质
下一篇：语音识别纠错方法及装置、计算机设备和记录介质

同类专利

音素误标注的检测方法和装置-201810827500.0
发明人：孟君;廖晓玲;郝玉峰 -专利权人：北京海天瑞声科技股份有限公司
申请日： 2018-07-25 - 公布日： 2020-01-31 - 主分类号： G10L13/08
摘要：本发明提供一种音素误标注的检测方法和装置，该方法包括：根据目标组合音素对应的目标语音、目标组合音素的音素标注结果、以及，预先设置的音素置信度模型，获取目标组合音素的音素标注结果的置信度，音素置信度模型用于表示目标语音、目标组合音素的音素标注结果、以及目标组合音素的音素标注结果的置信度的对应关系；在目标组合音素的音素标注结果的置信度小于置信度阈值时，确定目标组合音素为误标注音素。本发明采用预先设置的音素置信度模型，获取音素标注结果的置信度，进而可以快速、准确的获取误标注音素。

一种语音合成播放方法、装置和存储介质-201910848598.2
发明人：杨木文 -专利权人：腾讯科技(深圳)有限公司
申请日： 2019-09-09 - 公布日： 2019-12-20 - 主分类号： G10L13/08
摘要：本发明实施例公开了一种语音合成播放方法、装置和存储介质，其中，用户终端可以接收语音合成请求，并根据语音合成请求获取需要进行语音合成的待合成文本，然后将待合成文本发送至语音合成服务器进行语音合成，得到对应的合成语音，然后播放该合成语音，并接收对合成语音的发音校正请求，根据发音校正请求接收对应于合成语音的校正数据，将该校正数据发送至语音合成服务器用于更新合成语音，从而得到更新后的合成语音，将当前播放的合成语音替换为更新后的合成语音进行播放。相比于相关技术，本发明在播放合成语音的过程中，能够实时对播放的合成语音进行校正、更新，由此，即使在多音字的发音预测错误时，也能够及时校正其发音。

用于处理文本的方法和装置-201810695218.1
发明人：房伟伟 -专利权人：百度在线网络技术(北京)有限公司
申请日： 2018-06-29 - 公布日： 2019-12-13 - 主分类号： G10L13/08
摘要：本申请实施例公开了用于处理文本的方法和装置。该方法的一具体实施方式包括：获取待处理文本；分析待处理文本，得到待处理文本的情节信息，其中，情节信息用来描述待处理文本的内容；基于情节信息，确定待处理文本对应的语音特征信息，其中，语音特征信息用来表示待处理文本对应的语音的特征，语音特征信息包括以下至少一项：语速信息、音调信息和语气信息。该实施方式实现了通过对文本的分析处理得到文本对应的语音的语速、音调和语气等语音特征。

用于语言交互的配件、移动终端及交互系统-201910829041.4
发明人：王轶;张志扬;苏进;于勇;廉鹏飞;李琦 -专利权人：北京佳珥医学科技有限公司
申请日： 2019-09-03 - 公布日： 2019-12-03 - 主分类号： G10L13/08
摘要：本发明涉及电子设备领域，公开了一种用于语言交互的配件、移动终端及交互系统，该配件包括壳体以及设置在壳体中的第一通讯模块、音频采集模块以及处理器，其中：第一通讯模块，用于建立配件与相适配的移动终端的通讯连接；音频采集模块，用于采集当前用户的交流对象的待识别语音；以及处理器，包括语音识别模块，并与音频采集模块电性连接，用于通过第一通讯模块获取待识别语音，并将该待识别语音转换成当前用户设定的语种所对应的文字，通过第一通讯模块将文字发送至移动终端进行显示。本发明实现听力损失的用户与交流对象的无障碍交流。

语音合成方法、电子装置及存储介质-201910915659.2
发明人：李晋;叶子云;周成成 -专利权人：招商局金融科技有限公司
申请日： 2019-09-25 - 公布日： 2019-12-03 - 主分类号： G10L13/08
摘要：本发明涉及语音语义技术领域，提供了一种语音合成方法、电子装置及计算机存储介质，该方法包括：获取应答场景中的预设话术，所述话术包括固定文本和变量文本；根据所述应答场景从预设语音库中筛选出与所述应答场景相应的音色特征对所述话术中的固定文本进行录制，得到固定语音；再根据筛选出的所述音色特征对所述话术中的变量文本进行语音合成，得到与所述固定语音具有相同音色特征的变量语音；最后，拼接所述固定语音和所述变量语音，生成具有所述音色特征的合成语音。本发明根据应答场景合成具有音色统一的语音，使人机交互中语音自然连贯，进而提升用户的体验度。

一种智能语音播报的方法及系统-201910630232.8
发明人：贺来朋;刘露婕 -专利权人：云知声智能科技股份有限公司
申请日： 2019-07-12 - 公布日： 2019-11-29 - 主分类号： G10L13/08
摘要：本发明提供了一种智能语音播报的方法及系统，所述智能语音播报的方法执行以下步骤：步骤1：获取生成语音，包括待处理文本中的固定句式部分所采用的真人录音和槽位部分所采用的合成语音；步骤2：采用从真人录音与合成语音中提取的特征参数，对生成语音的特征参数进行调整，以提升合成语音与真人录音的一致性；步骤3：对生成语音的整句合成文本做文本分析，以保留上下文韵律信息，提升拼接处的韵律连贯性；步骤4：对真人录音做音效处理，并对真人录音与合成语音进行能量规整，以使真人录音与合成语音之间的能量变化趋于一致水平。此方法分别对合成语音和真人录音进行处理，提升合成语音与真人录音的相似度，以及拼接后的语音的整体一致性。

用于操作智能自动化助理的电子设备和方法、存储介质-201510855408.1
发明人： C·亨顿;D·奈克 -专利权人：苹果公司
申请日： 2015-11-30 - 公布日： 2019-11-19 - 主分类号： G10L13/08
摘要：本发明公开了在话音合成中消除同形异音词的歧义。提供了用于在话音合成中消除同形异音词的歧义的系统和处理。在一种示例性处理中，可以接收来自用户的包含同形异音词的话音输入。可以利用自动话音辨识系统对话音输入进行处理，以便确定对应于用户在话音输入中所发音的同形异音词的音素串。可以基于所述音素串或者利用自动话音辨识系统的n元语法语言模型的至少其中之一来确定同形异音词的正确发音。可以生成针对话音输入的对话响应，其中所述对话响应可以包括同形异音词。可以输出对话响应以作为话音输出。可以根据所述正确发音在话音输出中发音对话响应中的同形异音词。

多语种混语文本字音转换方法及系统-201510091480.1
发明人：闫润强;苏增亮;姚佳;祖漪清;王影;胡国平;胡郁;刘庆峰 -专利权人：讯飞智元信息科技有限公司
申请日： 2015-02-28 - 公布日： 2019-11-15 - 主分类号： G10L13/08
摘要：本发明公开了一种多语种混语文本字音转换方法及系统，该方法包括：接收待处理多语种混语文本；确定所述混语文本中的主语种文本及次语种文本；采用统一发音符号对所述混语文本中的主语种文本和次语种文本分别进行字音转换，得到主语种文本语音符号序列和次语种文本语音符号序列；修正所述次语种文本语音符号序列的韵律；连接所述主语种文本语音符号序列及修正后的次语种文本语音符号序列，得到混语文本语音符号序列。利用本发明，可以使主语种文本语音符号序列和次语种文本语音符号序列连接处的韵律感更平稳。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音合成播放方法、装置和存储介质在审

专利文献下载