[发明专利]语音转换方法、装置、电子设备及可读存储介质有效

申请号：	201710814245.1	申请日：	2017-09-11
公开（公告）号：	CN107705802B	公开（公告）日：	2021-01-29
发明（设计）人：	方博伟;卓鹏鹏;张康;尤嘉华;张伟	申请（专利权）人：	厦门美图之家科技有限公司
主分类号：	G10L25/18	分类号：	G10L25/18;G10L25/24;G10L15/06
代理公司：	北京超凡志成知识产权代理事务所(普通合伙) 11371	代理人：	苏胜
地址：	361000 福建省厦门市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种语音转换方法、装置、电子设备及可读存储介质。方法包括基于预设切分规则将输入语音切分为多个帧单元；提取每个帧单元的梅尔倒谱特征和基频特征；将帧单元归类到相应的音素集合；根据帧单元的梅尔倒谱特征和平行训练得到的高斯混合模型参数，计算得到输出梅尔倒谱特征；根据输入语音帧单元基频，原始音素集合的基频特征和目标语音素集合的基频特征，计算得到输出基频；根据输出梅尔倒谱特征及输出基频计算得到输入语音转换后对应的输出语音。该方法不仅改善因忽略语音瞬时信息而导致的语音连续性差的缺点，还弥补整体训练的高斯混合模型导致的频谱细节缺失的问题，使得合成语音发音更准确，连续，以及韵律保持更完好。
搜索关键词：	语音转换方法装置电子设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种语音转换方法，其特征在于，所述方法包括：基于预设切分规则将待转换说话人的输入语音切分为多个帧单元，其中，每个帧单元包括多个连续语音帧；提取每个所述帧单元的梅尔倒谱特征和基频特征；将所述帧单元归类到相应的语音音素集合；根据所述帧单元的梅尔倒谱特征和所述帧单元对应语音音素集合的高斯混合模型参数，计算得到输出梅尔倒谱特征；基于所述帧单元的基频和帧单元对应的原始语音音素集合的基频特征和目标语音音素集合的基频特征，计算得到输出基频，其中，所述原始语音音素集合为待转换说话人语音对应的语音音素集合，所述目标语音音素为目标音色说话人语音对应的语音音素集合；根据所述输出梅尔倒谱特征及输出基频计算得到所述输入语音对应的目标音色说话人的输出语音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于厦门美图之家科技有限公司，未经厦门美图之家科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710814245.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音转换方法、装置、电子设备及可读存储介质有效

专利文献下载