[发明专利]基于人工智能的语音合成方法、装置、设备及存储介质在审
| 申请号: | 202111138984.6 | 申请日: | 2021-09-27 |
| 公开(公告)号: | CN113870830A | 公开(公告)日: | 2021-12-31 |
| 发明(设计)人: | 张旭龙;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L25/48 |
| 代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 张传义 |
| 地址: | 518057 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人工智能 语音 合成 方法 装置 设备 存储 介质 | ||
1.一种基于人工智能的语音合成方法,其特征在于,包括:
获取移动终端发送的语音数据,其中,所述语音数据为由所述移动终端的用户定制的目标对象的语音数据;
根据所述语音数据生成语音样本数据集,获取用于将道路导航信息转化为语音数据的语音合成模型;
根据所述语音样本数据集对所述语音合成模型进行迭代训练,得到用于合成与所述目标对象具有相同音色的语音数据的目标语音合成模型;
将所述目标语音合成模型发送给所述移动终端,以供所述移动终端在获取到道路导航信息时,运行所述目标语音合成模型对所述道路导航信息进行处理,得到与所述目标对象具有相同音色的导航语音数据,并播报所述导航语音数据。
2.根据权利要求1所述的语音合成方法,其特征在于,所述语音合成模型包括音素编码器、拼接层、可变自适应器,所述根据所述语音样本数据集对所述语音合成模型进行迭代训练,包括:
从所述语音样本数据集中选择一个语音样本数据作为目标样本数据;
将所述目标样本数据中的音素信息输入所述音素编码器进行编码,得到音素向量;
将所述目标样本数据中的第一音素时长序列、第一音高序列和第一能量序列输入所述拼接层进行拼接,得到目标融合特征;
将所述音素向量、第一音素时长序列、第一音高序列、第一能量序列和目标融合特征输入所述可变自适应器进行处理,得到第二音素时长序列、第二音高序列和第二能量序列;
根据所述第一音素时长序列、第一音高序列、第一能量序列、第二音素时长序列、第二音高序列和第二能量序列,确定模型损失值;
根据所述模型损失值确定所述语音合成模型是否收敛,若所述语音合成模型未收敛,则更新所述语音合成模型的参数;
返回执行从所述语音样本数据集中选择一个语音样本数据作为目标样本数据的步骤,直至所述语音合成模型收敛。
3.根据权利要求2所述的语音合成方法,其特征在于,所述可变自适应器包括持续时长预测层、音高预测层、能量预测层,所述将所述音素向量、第一音素时长序列、第一音高序列、第一能量序列和目标融合特征输入所述可变自适应器进行处理,得到第二音素时长序列、第二音高序列和第二能量序列,包括:
将所述音素向量、所述目标融合特征和所述第一音素时长序列输入所述持续时长预测层进行音素时长预测,得到第二音素时长序列;
将所述音素向量、所述目标融合特征和所述第一音高序列输入所述音高预测层进行音高预测,得到第二音高序列;
将所述音素向量、所述目标融合特征和所述第一能量序列输入所述能量预测层进行能量预测,得到第二能量序列。
4.根据权利要求2所述的语音合成方法,其特征在于,所述根据所述第一音素时长序列、第一音高序列、第一能量序列、第二音素时长序列、第二音高序列和第二能量序列,确定模型损失值,包括:
基于预设均方误差函数,计算所述第一音素时长序列与所述第二音素时长序列之间的均方误差,得到第一损失值;
基于预设均方误差函数,计算所述第一音高序列与所述第二音高序列之间的均方误差,得到第二损失值;
基于预设均方误差函数,计算所述第一能量序列与所述第二能量序列之间的均方误差,得到第三损失值;
对所述第一损失值、所述第二损失值和所述第三损失值进行加权求和,得到模型损失值。
5.根据权利要求1-4中任一项所述的语音合成方法,其特征在于,所述根据所述语音数据生成语音样本数据集,包括:
将所述语音数据拆分为多个语音片段,得到语音片段集,其中,一个所述语音片段包括至少一个语句;
确定所述语音片段集的语音片段个数,并根据预设的总样本个数和所述语音片段个数,确定扩充倍率;
按照所述扩充倍率对所述语音片段集进行扩充,得到目标语音片段集;
生成所述目标语音片段集中的各语音片段对应的语音样本数据,并汇集各所述语音样本数据,得到所述语音样本数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111138984.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体器件
- 下一篇:路况信息监控方法、装置、计算机设备及存储介质





