[发明专利]一种高质量的语音转换方法有效
申请号: | 201710166971.7 | 申请日: | 2017-03-20 |
公开(公告)号: | CN107103914B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 李燕萍;崔立梅;吕中良 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/18;G10L25/27;G10L25/48;G10L15/06;G10L15/14;G10L13/02 |
代理公司: | 江苏海越律师事务所 32402 | 代理人: | 唐小红 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种高质量的语音转换方法,该系统首先通过自组织聚类算法代替传统GMM模型中的K‑Means算法,并与EM算法迭代循环实现了说话人个性特征参数(MFCC)的训练及分类,接着进行双线性频率弯折加幅度压扩的训练,得到语音转换所需的转换函数,然后使用该转换函数进行高质量的语音转换。本发明针对语音特征参数空间分布状况与高斯混合模型的相关关系,使用迭代自组织聚类算法实现混合度的确定,解决了高斯混合模型在进行语音特征参数分类时不精确的问题,并将改进的高斯混合模型和双线性频率弯折加幅度压扩相结合,构建了一种高质量语音转换系统,在语音转换领域具有实用价值。 | ||
搜索关键词: | 一种 质量 语音 转换 方法 | ||
【主权项】:
一种高质量的语音转换方法,包括训练部分和转换部分:1)、训练部分步骤:1‑1)获取源说话人和目标说话人的平行语料库;1‑2)使用AHOcoder语音分析模型提取语音特征参数和对数基频;1‑3)对步骤1‑2)中的语音特征参数进行DTW;2)、转换部分步骤:2‑1)输入待转换的源说话人语音;2‑2)使用AHOcoder语音分析模型提取特征参数和对数基频;2‑3)使用ISODATA+GMM和训练时得到的参数λ,求取后验条件概率矩阵;2‑4)将频率弯折因子α(x,λ)和幅度调节因子s(x,λ)代入BLFW+AS转换函数,求得转换后的特征参数;2‑5)将对数基频代入训练时得到的基频转换函数得到转换后的对数基频;2‑6)使用AHOdecoder语音合成模型将转换后的特征参数和对数基频合成转换后的语音。其特征在于,所述训练部分步骤中,还包括:1‑4)使用迭代自组织算法ISODATA对步骤1‑3)中的特征参数进行GMM训练的初始值设定,并用EM算法进行GMM训练,得到GMM参数λ,P(X|λ);1‑5)使用步骤1‑4)中的后验条件概率矩阵P(X|λ)进行BLFW+AS训练,得到频率弯折因子α(x,λ)和幅度调节因子s(x,λ),从而构建BLFW+AS转换函数;使用对数基频的均值和方差建立源语音基音频率和目标语音基音频率之间的转换函数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710166971.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种钢琴弹奏音准的检测装置
- 下一篇:一种音频数据处理方法以及装置