[发明专利]一种快速合成TTS语音的方法及装置在审
| 申请号: | 201811611687.7 | 申请日: | 2018-12-27 |
| 公开(公告)号: | CN109448694A | 公开(公告)日: | 2019-03-08 |
| 发明(设计)人: | 林婷;郭志煌 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
| 主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L15/26 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 李彬彬;张丽 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 快速合成 语音交互 融合策略 应答文本 智能语音设备 方法和装置 设备配置 信息确定 硬件条件 客户 | ||
本发明公开一种快速合成TTS语音的方法,包括如下步骤:获取应答文本信息;根据应答文本信息确定融合策略;根据确定的融合策略生成TTS语音。本发明还公开了一种快速合成TTS语音的装置。根据本发明公开的方法和装置可以实现减少智能语音设备与用户的语音交互时间,从而提高语音交互的功能,并且在设备配置较低的硬件条件下,也可以提供给客户完美的语音交互体验。
技术领域
本发明涉及语音交互技术领域,特别是一种快速合成TTS语音的方法及装置。
背景技术
随着语音交互技术的不断发展,语音交互的应用越来越多,现有技术中语音交互技术的实现原理如下:用户说话发出语音指令,设备识别语音指令,对该语音指令进行语义理解,根据语义输出需要应答该条语音指令的文字信息,将文字信息转换为TTS语音播放出来,从而实现智能语音设备与用户间的语音交互,这样可以达到所问即可答,即实现人机流畅沟通。
但在这种语音交互场景中,TTS合成速度是影响用户体验重要的一步。特别是在现有技术中,可搭载语音技术的硬件配置参差不齐,这就导致需要语音交互功能能够适配各种高配置或低配置的机型,对于低配置的机型,在语音交互过程中往往会导致TTS合成的速度较慢,影响用户的语音交互体验。
发明内容
为了解决上述问题,发明人构思从TTS合成过程出发,通过融合策略来进行TTS合成处理,以提高语音的响应速度。
根据本发明的第一个方面,提供了一种快速合成TTS语音的方法,包括如下步骤:
获取应答文本信息;
根据应答文本信息确定融合策略;
根据确定的融合策略生成TTS语音。
根据本发明的第二个方面,提供了一种快速合成TTS语音的装置,包括:
应答信息获取模块,用于获取应答文本信息;
策略确定模块,用于根据应答文本信息确定融合策略;
语音输出模块,用于根据确定的融合策略生成TTS语音。
根据本发明的第三个方面,提供了一种电子设备,其包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法的步骤。
根据本发明的第四个方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。
本发明提供的装置和方法通过融合策略来进行TTS合成处理,而融合策略是基于应答文本信息来确定的,因而能够基于应答信息进行灵活的语音合成处理,可以实现减少智能语音设备与用户的语音交互时间,从而提高语音交互的功能。并且,基于本发明提供的装置和方法,在设备配置较低的硬件条件下,也可以提供给客户完美的语音交互体验。
附图说明
图1为本发明一实施方式的快速合成TTS语音的方法流程图;
图2为本发明一实施方式的快速合成TTS语音的装置原理框图;
图3为本发明又一实施方式的快速合成TTS语音的装置原理框图;
图4为本发明一实施方式的电子设备框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811611687.7/2.html,转载请声明来源钻瓜专利网。





