[发明专利]语音数据生成方法、装置、电子设备及存储介质有效
申请号: | 201911204314.2 | 申请日: | 2019-11-29 |
公开(公告)号: | CN111223475B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 杨鹏 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L15/06;G10L19/04 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 宁立存 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 数据 生成 方法 装置 电子设备 存储 介质 | ||
本公开是关于一种语音数据生成方法、装置、电子设备及存储介质,属于互联网技术领域。方法包括:获取声学特征向量,声学特征向量包括待生成语音数据的音色特征,基于特征处理模型,获取声学特征向量对应的线性预测残差的分布特征,根据与声学特征向量的维数匹配的采样数量,对分布特征进行采样,得到线性预测残差,基于声学特征向量和线性预测残差,生成具有音色特征的语音数据。特征处理模型根据具有不同音色的多个样本对象发出的样本语音数据训练得到,能够适用于多种音色,因此基于该特征处理模型,可以生成具有任一种音色的语音数据,生成的语音数据的音色具有多样性,提高了适用性。
技术领域
本公开涉及计算机技术领域,尤其涉及一种语音数据生成方法、装置、电子设备及存储介质。
背景技术
语音合成技术是利用声学、语言学、数字信号处理、计算机科学等生成语音数据的技术,目前已应用到越来越多的电子设备中。随着用户对语音数据的质量要求越来越高,如何基于语音合成技术生成高质量的语音数据成为亟待解决的问题。
相关技术中,根据一个样本对象发出的多条样本语音数据,训练语音数据生成模型,后续即可基于该语音数据生成模型生成语音数据。但是,由于该多条样本语音数据中仅包含该样本对象的音色,因此训练出的语音数据生成模型仅能够生成具有该音色的语音数据,而无法生成具有其他音色的语音数据,因此,上述方法生成的语音数据的音色单一,适用性差。
发明内容
本公开提供了一种语音数据生成方法、装置、电子设备及存储介质,能够克服相关技术中存在的生成的语音数据的音色单一以及适用性差的问题。
根据本公开实施例的第一方面,提供一种语音数据生成方法,所述方法包括:
获取声学特征向量,所述声学特征向量包括待生成语音数据的音色特征;
基于特征处理模型,获取所述声学特征向量对应的线性预测残差的分布特征,所述特征处理模型根据具有不同音色的多个样本对象发出的样本语音数据训练得到;
根据与所述声学特征向量的维数匹配的采样数量,对所述分布特征进行采样,得到线性预测残差;
基于所述声学特征向量和所述线性预测残差,生成具有所述音色特征的语音数据。
在一种可能实现方式中,所述获取声学特征向量,包括:
获取待生成语音数据的文本数据;
获取所述文本数据对应的文本特征向量;
基于与目标音色对应的特征转换模型,获取所述文本特征向量对应的声学特征向量,所述声学特征向量包括所述目标音色的音色特征。
在另一种可能实现方式中,所述基于所述声学特征向量和所述线性预测残差,生成具有所述音色特征的语音数据,包括:
将所述声学特征向量和所述线性预测残差进行叠加,得到所述语音数据。
在另一种可能实现方式中,所述基于特征处理模型,获取所述声学特征向量对应的线性预测残差的分布特征之前,所述方法还包括:
获取多条样本语音数据的样本声学特征向量和样本线性预测残差,所述多条样本语音数据由具有不同音色的多个样本对象发出;
对于每条样本语音数据,基于所述特征处理模型,获取所述样本声学特征向量对应的目标线性预测残差的分布特征;
根据与所述样本声学特征向量的维数匹配的采样数量,对所述分布特征进行采样,得到目标线性预测残差;
根据所述目标线性预测残差与所述样本线性预测残差之间的差异,训练特征处理模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911204314.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置