[发明专利]子带清浊音模糊判决的方法无效
申请号: | 200610165246.X | 申请日: | 2006-12-15 |
公开(公告)号: | CN101009096A | 公开(公告)日: | 2007-08-01 |
发明(设计)人: | 崔慧娟;唐昆;李晔;洪侃 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/08;G10L19/14;G10L11/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084北京市100*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 子带清浊音模糊判决方法,属于低速率语音压缩编码技术领域。其特征在于,在利用目前通用的带通浊音度参数提取方法得到除第一子带以外的其余四个子带的浊音隶属度后,将第一个子带滤波后信号的自相关函数在基音周期参数处的值乘以一个设定的增益因子,作为第一个子带的浊音隶属度,如果结果超过1,则令其等于1;将各子带的浊音隶属度一起进行矢量量化,得到量化后各子带的浊音隶属度,和基音周期参数等一起合成激励信号。这种方法可以提高合成语音的自然度。该方法适合低速率参数语音编码。 | ||
搜索关键词: | 子带清 浊音 模糊 判决 方法 | ||
【主权项】:
1、子带清浊音模糊判决的方法,其特征在于该方法包括以下步骤:(1)对输入语音信号样点按时间顺序分帧;(2)对当前帧提取基音周期参数;(3)对当前帧提取余量谱幅度参数;(4)将当前帧语音信号经过5个6阶的巴特沃思滤波器进行滤波,得到通带分别为0-500,500-1000,1000-2000,2000-3000和3000-4000Hz的5个子带信号;(5)根据第一个子带的语音信号对步骤(2)中求取的基音周期参数进一步改善,改善后的基因周期值为
(6)求取第一个子带语音信号的自相关函数在步骤(5)中求取的基音周期参数
位置上的值Vbpn,1;(7)求取其余4个子带语音信号的自相关函数以及其时间包络的自相关函数在步骤(5)中求取的基音周期参数
位置上的值,并分别对每个子带取两者中的较大值:Vbpn,i=max{Vbpn,i′,Vbpn,i″}i=2,3,4,5其中,Vbpn,i′表示当前帧,即第n帧的第i子带的自相关函数在
位置上的值;Vbpn,i″表示当前帧,即第n帧的第i子带的时间包络的自相关函数在
位置上的值;(8)如果步骤(6)中求取的值Vbpn,1小于0.6,则将步骤(7)中的值全部修改为0,即Vbpn,i=0 i=2,3,4,5,否则保持不变;(9)将步骤(6)中求取的值Vbpn,1乘以一个设定的增益因子,该增益因子设定为1.2,如果相乘后结果大于1,则令其等于1,即:Vbp n , 1 = 1 if Vbp n , 1 × 1.2 > 1 Vbp n , 1 × 1.2 if Vbp n , 1 × 1.2 ≤ 1 ]]>(10)将步骤(8)与步骤(9)中求取的值作为各子带的浊音隶属度,合并成为一个矢量Vbp ‾ = ( Vbp n , 1 , Vbp n , 2 , Vbp n , 3 , vbp n , 4 , Vbp n , 5 ) ]]>,一起进行矢量量化;矢量量化采用对码本中的码字进行全搜索的方法获得最优量化码字:
其中
表示待量化的输入矢量,
表示码本中的码字矢量,C表示码本,i是码字矢量在码本中的索引值,Er()函数表示特定的失真测度,这里采用最小加权均方误差,即Er ( Vbp ‾ , Vbp ‾ i ) = Σ k = 1 5 W k ( Vbp k - Vbp i , k ) 2 ]]>,其中Vbpk为待量化矢量的第k个分量,Vbpi,k为码本中第i个码字矢量的第k个分量,W为加权因子向量,这里取W=[16,8,4,2,1];量化后得到量化的各子带的浊音隶属度
(11)将步骤(10)中得到的各子带的浊音隶属度、步骤(3)中的余量谱幅度参数以及步骤(5)中的基音周期参数一起用来合成激励信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610165246.X/,转载请声明来源钻瓜专利网。