[发明专利]一种基于简化自适应内插加权谱模型的语音转换及重构方法有效
申请号: | 201210401029.1 | 申请日: | 2012-10-19 |
公开(公告)号: | CN102930863A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 汤一彬;高远;徐宁;单鸣雷;朱昌平;蒋爱民;韩庆邦;殷澄 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G10L13/00 | 分类号: | G10L13/00;G10L13/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于简化自适应内插加权谱模型的语音转换及重构方法。在语音分析阶段省略了非周期成分的提取过程,从而简化并避免了非周期成分参数的输出。同时,在语音合成阶段又基于平滑功率谱参数建立高斯混合模型,对非周期成分参数进行估计和重构,从而满足原传统模型的输入参数要求。该简化模型与传统模型相比,其合成语音质量总体相当,在男声语音方面甚至更优于传统模型。此外,由于在分析阶段中省略了复杂的非周期成分提取过程,使得简化方法模型的计算量大为减小。 | ||
搜索关键词: | 一种 基于 简化 自适应 内插 加权 模型 语音 转换 方法 | ||
【主权项】:
1.一种基于简化自适应内插加权谱模型的语音转换及重构方法,其特征在于,包括非周期成分参数重构过程,所述的非周期成分参数重构过程,包含以下步骤:(1)、训练阶段:(1a)、在美尔倒谱系数MFCC获取模块中输入平滑功率谱参数的训练集{Pi(w)},1≤i≤T,获得对应的美尔倒谱MFCC系数集{Mi},其中Mi=DCT{logΦPi(w)},Φ为人类听觉感知的权重函数,DCT{.}表示离散余弦变换,T为语音总帧数;(1b)、在高斯混合模型GMM模块中对MFCC系数集采用进行最大期望值EM算法训练,更新高斯混合模型GMM中各状态参数,直至参数稳定为止,并记录高斯混合模型GMM中的各状态参数,备重构阶段使用;对于高斯混合模型GMM,设输入参数集为{xi}={Mi},1≤i≤T,设输入参数为x的概率分布p(x)为:p ( x ) = Σ q = 1 Q α q N ( x ; μ q ; Σ q ) , ]]> 约束条件为Σ q = 1 Q α q = 1 , ]]> αq≥0,其中,Q,αq分别为高斯成分数量及对应权重系数,μq,∑q分别为第q个D维高斯正态分布N(x;μq;∑q)的均值和协方差矩阵,1≤q≤Q,正态分布N(x;μq;∑q)定义为:N ( x ; μ q ; Σ q ) = 1 ( 2 π ) D / 2 | Σ q | 1 / 2 exp [ - 1 2 ( x - μ q ) T Σ q - 1 ( x - μ q ) ] , ]]> 其中,(.)T和(.)-1分别代表矩阵转置和求逆,对第i个输入参数xi,利用最大期望值EM算法进行更新,更新准则:β q ( x i ) = α q N ( x i ; μ q ; Σ q ) Σ j = 1 Q α j N ( x i ; μ j ; Σ j ) , ]]>μ q = Σ i = 1 T β q ( x i ) x i Σ i = 1 T β q ( x i ) , ]]>Σ q = Σ i = 1 T β q ( x i ) ( x i - μ q ) T ( x i - μ q ) D Σ i = 1 T β q ( x i ) , ]]>α q = 1 T Σ i = 1 T β q ( x i ) , ]]> 其中,βq(xi)为xi所属为第q类时的后验概率,αj,μj,∑j分别对应为第j个高斯成分的权重系数,第j个D维高斯正态分布N(x;μj;∑j)的均值和协方差矩阵;(1c)、美尔倒谱系数分类模块中,对输入美尔倒谱系数MFCC集按高斯混合模型GMM中的最大后验概率准则进行分类;对输入参数xi=Mi,则将Mi分入第J类,准则为在所有的类中,1≤q≤Q,寻找后验概率最大的βq(xi),获取此时对应的q,并将q的数值赋给J,即
(1d)、平滑功率谱分类模块中,对与美尔倒谱系数MFCC相对应的各平滑功率谱参数进行分类,若美尔倒谱系数MFCC的Mi分入第J类,则对应的平滑功率谱参数Pi(w)也分入第J类;(1e)、非周期成分分类及其估计模块中,对与平滑功率谱参数Pi(w)相对应的训练非周期成分参数api进行分类,计算各类的中心数值,并作为各类非周期成分参数的估计值。若平滑功率谱参数Pi(w)分入第J类,则对应的非周期成分参数api也分入第J类,其第J类的非周期成分的中心数值为
(2)、重构阶段:(2a)、在美尔倒谱系数MFCC获取模块中输入所需重构的非周期成分参数对应的平滑功率谱参数Pi(w),获得对应的MFCC系数Mi;(2b)、在高斯混合模型GMM模块中,对输入MFCC系数,xi=Mi,计算各高斯成分所对应的概率β q ( x i ) = α q N ( x i ; μ q ; Σ q ) Σ j = 1 Q α j N ( x i ; μ j ; Σ j ) ; ]]> (2c)、美尔倒谱系数分类模块中,对输入MFCC系数Mi按GMM中的最大后验概率确定其所属第J类,
(2d)、平滑功率谱分类模块中,对与MFCC系数Mi相对应的平滑功率谱参数Pi(w)确定其所属第J类;(2e)、非周期成分分类及其估计模块中,将平滑功率谱参数Pi(w)所属第J类对应的非周期成分参数的估计值作为该非周期成分参数的重构数值,![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210401029.1/,转载请声明来源钻瓜专利网。