[发明专利]语音合成方法、装置、存储介质和电子设备有效
申请号: | 202010167710.9 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111369971B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 殷翔;顾宇 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L13/08;G10L13/04 |
代理公司: | 泰和泰律师事务所 51219 | 代理人: | 祝海燕 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种语音合成方法、装置、存储介质和电子设备,所述方法包括:获取待合成文本对应的语音特征信息,所述语音特征信息包括韵律边界信息,所述韵律边界信息用于将所述待合成文本划分成多个韵律词;确定所述待合成文本的文本特征对应的目标韵律模式;根据所述目标韵律模式对应的韵律特征对每一所述韵律词进行语音合成获得所述待合成文本对应的声学特征;根据所述声学特征,获得与所述待合成文本对应的音频信息。因此,在进行语音合成时,充分考虑了用户正常的朗读韵律,从而可以使得语音合成后获得音频信息符合人类的朗读韵律,避免现有技术中机械朗读给用户造成的不适。同时,使得语音合成的音频数据与待合成文本的文本特征相匹配。
技术领域
本公开涉及计算机技术领域,具体地,涉及一种语音合成方法、装置、存储介质和电子设备。
背景技术
现今,随之计算机技术的快速发展,阅读器逐渐成为人们生活中不可或缺的应用,用户可以通过阅读器实现人机交互,也可以通过阅读器中的语音合成技术实现听书的功能。
但在现有技术中,通常是直接将待合成文本进行简单的机械语音合成,从而导致合成出的语音与用户日常阅读习惯不匹配,使得生成的语音数据与文本内容难以匹配。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种语音合成方法,所述方法包括:
获取待合成文本对应的语音特征信息,所述语音特征信息包括韵律边界信息,所述韵律边界信息用于将所述待合成文本划分成多个韵律词;
确定所述待合成文本的文本特征对应的目标韵律模式;
根据所述目标韵律模式对应的韵律特征对每一所述韵律词进行语音合成获得所述待合成文本对应的声学特征;
根据所述声学特征,获得与所述待合成文本对应的音频信息。
第二方面,本公开提供一种语音合成装置,所述装置包括:
获取模块,用于获得待合成文本对应的语音特征信息,所述语音特征信息包括韵律边界信息,所述韵律边界信息用于将所述待合成文本划分成多个韵律词;
第一确定模块,用于确定所述待合成文本的文本特征对应的目标韵律模式;
第一合成模块,用于根据所述目标韵律模式对应的韵律特征对每一所述韵律词进行语音合成获得所述待合成文本对应的声学特征;
处理模块,用于根据所述声学特征,获得与所述待合成文本对应的音频信息。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开语音合成方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现实现本公开语音合成方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010167710.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:路侧感知系统
- 下一篇:身份识别方法、装置、设备及存储介质