[发明专利]语音合成方法和装置、电子设备及存储介质在审

申请号：	202110783977.5	申请日：	2021-07-12
公开（公告）号：	CN113409760A	公开（公告）日：	2021-09-17
发明（设计）人：	周鸿斌;李林;苏志霸;贺雯迪;叶剑豪;任凯盟;贺天威;卢恒	申请（专利权）人：	上海喜马拉雅科技有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/04;G10L25/21
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	张萌
地址：	201100 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供的语音合成方法和装置、电子设备及存储介质，涉及语音合成技术领域。语音合成方法包括：首先，获取待处理语音数据的对数梅尔能量谱；其次，将待处理语音数据的对数梅尔能量谱输入预设的语音合成模型，得到第一合成音频，其中，预设的语音合成模型根据训练数据的对数梅尔能量谱进行训练得到。通过上述方法，可以实现通过对数梅尔能量谱就可以得到合成音频，避免了现有技术中语音合成方法需要的参数量较多，所导致的语音合成效率低的问题。

技术领域

本申请涉及语音合成技术领域，具体而言，涉及一种语音合成方法和装置、电子设备及存储介质。

背景技术

人工合成人类语音被称为语音合成，这种基于机器学习的技术适用于文本转换语音(text-to-speech)、音乐生成、语音生成、语音支持设备、导航系统以及为视障人士提供无障碍服务等应用场景。但是，经发明人研究发现，在现有技术中的语音合成方法需要的参数量较多，从而存在着语音合成的效率低的问题。

发明内容

有鉴于此，本申请的目的在于提供一种语音合成方法和装置、电子设备及存储介质，以改善现有技术中存在的问题。

为实现上述目的，本申请实施例采用如下技术方案：

第一方面，本发明提供一种语音合成方法，包括：

获取待处理语音数据的对数梅尔能量谱；

将所述待处理语音数据的对数梅尔能量谱输入预设的语音合成模型，得到第一合成音频，其中，所述预设的语音合成模型根据训练数据的对数梅尔能量谱进行训练得到。

在可选的实施方式中，所述获取待处理语音数据的对数梅尔能量谱的步骤，包括：

获取所述待处理语音数据；