[发明专利]一种快速合成TTS语音的方法及装置在审
| 申请号: | 201811611687.7 | 申请日: | 2018-12-27 |
| 公开(公告)号: | CN109448694A | 公开(公告)日: | 2019-03-08 |
| 发明(设计)人: | 林婷;郭志煌 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
| 主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L15/26 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 李彬彬;张丽 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 快速合成 语音交互 融合策略 应答文本 智能语音设备 方法和装置 设备配置 信息确定 硬件条件 客户 | ||
1.快速合成TTS语音的方法,其特征在于,包括如下步骤:
获取应答文本信息;
根据应答文本信息确定融合策略;
根据确定的融合策略生成TTS语音。
2.根据权利要求1所述的方法,其特征在于,其中,所述融合策略包括高频策略、本地合成策略和云端合成策略,所述方法还包括
配置高频语音库,所述高频语音库包括语料和对应的语音;
所述根据应答文本信息确定融合策略包括
将应答文本信息与语料进行匹配,在匹配成功时将融合策略确定为高频策略;
当匹配失败时,获取网络状态进行判断,根据网络状态将融合策略确定为本地合成策略或云端合成策略。
3.根据权利要求2所述的方法,其中,当融合策略确定为高频策略时,根据确定的融合策略生成TTS语音包括
获取与当前应答文本信息匹配的语料对应的语音,将获取的对应的语音作为TTS语音输出;
当融合策略确定为本地合成策略时,根据确定的融合策略生成TTS语音包括
通过本地合成引擎将应答文本信息合成为TTS语音;
当融合策略确定为云端合成策略时,根据确定的融合策略生成TTS语音包括
将应答文本信息输出至云端合成引擎,并获取云端合成引擎返回的语音信息;
对返回的语音信息进行解码,生成TTS语音。
4.根据权利要求2或3所述的方法,其特征在于,在根据本地合成策略或云端合成策略生成TTS语音后,还包括
判断当前生成的TTS语音是否为高频语音,当确定为高频语音时,将当前TTS语音及其对应的应答文本信息存储至所述高频语音库。
5.快速合成TTS语音的装置,其特征在于,包括:
应答信息获取模块,用于获取应答文本信息;
策略确定模块,用于根据应答文本信息确定融合策略;
语音输出模块,用于根据确定的融合策略生成TTS语音。
6.根据权利要求5所述的装置,其特征在于,所述融合策略包括高频策略、本地合成策略和云端合成策略,所述装置还包括
高频语音库,用于存储高频语音及其对应的语料;
本地合成引擎,用于根据输入的文本信息合成TTS语音;
语音输出模块包括
高频合成单元,用于根据应答文本信息从高频语音库获取对应的语音作为TTS语音输出;
本地合成单元,用于调用本地合成引擎将应答文本信息合成为TTS语音输出;
云端合成单元,用于将应答文本信息输出至云端合成引擎,并接收云端合成引擎返回的语音信息,将其解码为TTS语音输出。
7.根据权利要求6所述的装置,其特征在于,还包括
高频语音添加模块,用于对本地合成单元和云端合成单元输出的TTS语音及其对应的应答文本信息进行判断,在确定为高频语音时,将TTS语音及其对应的应答文本信息添加至所述高频语音库。
8.根据权利要求5至7任一项所述的装置,其特征在于,还包括
语音处理模块,用于接收用户语音指令进行识别和解析,并根据识别和解析结果生成应答文本信息输出至所述应答信息获取模块。
9.电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任意一项所述方法的步骤。
10.存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811611687.7/1.html,转载请声明来源钻瓜专利网。





