[发明专利]一种基于动态规划的基音周期提取方法无效
申请号: | 200710065401.5 | 申请日: | 2007-04-13 |
公开(公告)号: | CN101030375A | 公开(公告)日: | 2007-09-05 |
发明(设计)人: | 崔慧娟;唐昆;魏旋;党晓妍 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084北京市100*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于语音编码技术领域,其特征在于,采用逆滤波进行谱平坦操作,并把逆滤波零点位置限制在单位圆内的一个单位圆的同心圆中,避免了零点处谐波被过度衰减;同时该动态规划方法考虑了基音周期的正常变化与自身提取错误的情况,使用分段函数计算路径代价,并且对刚过去一帧与当前帧的路径代价限幅,以避免错误传播。由于清音不含周期信息,不能参与动态规划,该算法需要输入清浊音信息,但清浊音的判决错误同样不可避免,所以该算法使用帧间加权来减弱清音帧判断错误对算法的影响。本发明能在较低延时下取得更好的提取性能。 | ||
搜索关键词: | 一种 基于 动态 规划 基音 周期 提取 方法 | ||
【主权项】:
1、一种基于动态规划的基音周期提取方法,其特征在于,所述方法是在数字集成电路中依次按以下步骤实现的:步骤(1)对输入的语音信号用一个高通滤波器滤去直流分量和工频干扰;步骤(2)对步骤(1)所述经过高通滤波的语音信号用一个低通滤波器去除影响基音提取的高频信号;步骤(3)对于低通滤波的输出信号sLP(n)用下述二阶LPC逆滤波器进行逆滤波,其中该二阶LPC逆滤波器的零点被限制在一个半径比单位圆小并与单位圆同心的圆内,得到残差信号eLP(n),其中,所述的二阶LPC逆滤波器的传输函数H(z)为:H(z)=1+a1z-1+a2z-2,其中,α 1 = α 1 ′ α 2 ′ ≤ γ 2 α 1 ′ * γ / α 2 ′ α 2 ′ > γ 2 , α 2 = α 2 ′ α 2 ′ ≤ γ 2 γ 2 α 2 ′ > γ 2 , ]]>α 1 ′ = - r s ( 0 ) r s ( 1 ) - r s ( 1 ) r s ( 2 ) r s ( 0 ) 2 + r s ( 1 ) 2 , α 2 ′ = - r s ( 0 ) r s ( 2 ) - r s ( 1 ) 2 r s ( 0 ) 2 + r s ( 1 ) 2 , ]]> 其中,γ=0.96,rs(0),rs(1),rs(2)为sLP(n)的自相关系数,其中,r s ( m ) = Σ n = 0 N - 1 - m S LP ( n ) S LP ( n + m ) Σ n = 0 n - 1 S LP ( n ) S LP ( n ) , ]]> m=0,1,2,其中,n用来表示各个采用点,每帧信号中样点总数N取200;步骤(4)在给定的基音周期范围内,求出残差信号的各个自相关值r(m),m=18~148,r ( m ) = Σ n = 0 N - 1 - m e LP ( n ) e LP ( n + m ) Σ n = 0 n - 1 e LP ( n ) e LP ( n ) ]]> 同时,找出自相关函数的最大值点的位置p0和相应的自相关值Rmax;步骤(5)进行倍频检测,调整步骤(4)中所计算的自相关函数值:如果下式条件满足r(p)≥αRmax则令r(p)=Rmax-ε其中p取p0/2、或p0/3、或p0/4,α、ε为常数值,分别取0.8和0.0001,p0为步骤(4)中所找出的自相关函数的最大值点的位置;步骤(6)以需要判决基音周期的当前帧为0帧,用Frm(0)表示,以下一个前瞻帧为1帧,用Frm(1)表示,以刚过去的一帧为-1帧,用Frm(-1)表示,在所述Frm(0)、Frm(1)中的全部自相关值中依次各选出前5个最大的极大值点作为备选基音周期,把k帧的第n个极大值点记为Pn(k),对应的自相关值Rn(k),其中k=0,1,n=1,2,...,5,对于已经进行过基音提取的Frm(-1),仅使用提取结果p(-1);步骤(7)分别记录Frm(0)、Frm(1)、Frm(-1)各帧的功率,分别记为σ(-1)、σ(0)、σ(1),按下式计算一条完全穿过Frm(-1)、Frm(0)、Frm(1)的完整路径P ( - 1 ) - > P i ( 0 ) - > P j ( 1 ) ]]> 的路径代价Ca,其中Pi(0)、Pj(1)分别是步骤(6)所述的Frm(0)、Frm(1)中依次选定的的5个备选基音周期中任意的一个,C α ( P ( - 1 ) , P i ( 0 ) , P j ( 1 ) ) = min { C p ( P ( - 1 ) , P i ( 0 ) ) , T pc } * w f ( σ ( - 1 ) - σ ( 0 ) ) + ]]>( C p ( P i ( 0 ) , P j ( 1 ) ) + C r ( R j ( 1 ) ) ) * w f ( σ ( 1 ) - σ ( 0 ) ) + ]]>C r ( R i ( 0 ) ) ]]> 其中TPC=0.42,Cp(P(-1)),Pi(0))、Cp(Pi(0),Pj(1))依次分别是路径![]()
的路径代价,各依次按下式计算:C p ( P ( - 1 ) , P i ( 0 ) ) = α ( max { | P ( - 1 ) - P i ( 0 ) | max { P ( - 1 ) , P i ( 0 ) } - Δ , 0 } ) 2 ]]>C p ( P i ( 0 ) , P j ( 1 ) ) = α ( max { | P i ( 0 ) - P j ( 1 ) | max { P i ( 0 ) , P j ( 1 ) } - Δ , 0 } ) 2 ]]> 其中,α=3.175,Δ=0.1;wf(σ(-1)-σ(0))和wf(σ(1)-σ(0))为过去帧的能量加权函数,由下式决定:
其中Δσf在wf(σ(-1)-σ(0))和wf(σ(1)-σ(0))中分别对应σ(-1)-σ(0)和σ(1)-σ(0);Cr(Rj(1))、Cr(Ri(0))依次分别为Pi(0)、Pj(1)相对应的点代价函数值,按下式分别计算:C r ( R n k ) = 1 - R n k , ]]> n=i时k=0;n=j时k=1,步骤(8),遍历由P ( - 1 ) - > P i ( 0 ) - > P j ( 1 ) ]]> 的各条完整路径,找出完整路径代价最的一条路径为正确的路径轨迹,并取该路径上在当前帧位置上的点Pn(0)为基音周期。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710065401.5/,转载请声明来源钻瓜专利网。
- 上一篇:等离子体显示设备及其驱动方法
- 下一篇:井下人员定位装置