[发明专利]一种窄带码流转换为宽带码流的转换方法有效
申请号: | 201310033941.0 | 申请日: | 2012-01-17 |
公开(公告)号: | CN103093757A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 陈喆;殷福亮;李文月 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G10L19/07 | 分类号: | G10L19/07;G10L19/13 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种窄带码流转换为宽带码流的转换方法,所述的装置包括扩展单元和训练单元,所述的扩展单元包括窄带码流分离单元、窄带码流解析单元、窄带能量计算单元、码书映射单元、函数映射单元、高频时域包络及频域包络编码单元、高频能量编码单元、码流合成单元以及高频能量解码单元。所述的方法包括以下步骤:窄带码流解析;码书映射;窄带能量计算;函数映射;编码和码流合成。本发明第一次实现了将G.729编码得到的窄带码流扩展成可以作为G.729.1解码器输入的宽带码流,可以直接将现有电话通信网络传来的窄带码流直接通过G.729.1解码输出得到宽带语音,实现了宽带终端对窄带终端的兼容。 | ||
搜索关键词: | 一种 窄带 流转 宽带 转换 方法 | ||
【主权项】:
1.一种窄带码流转换为宽带码流的转换方法,其特征在于:在进行窄带码流到宽带码流的在线转换之前,对于工作语种需要且仅需要一次“离线”建立转换时所需要的映射关系,即进行窄带码流转换成宽带码流时所需转换关系的训练;在完成训练后再进行窄带码流转换成宽带码流,具体包括以下步骤:A、窄带码流解析A1、窄带码流分离窄带码流分离单元(11)将接收到的窄带码流前18bit分离出来,即为L0、L1、L2、L3,其中第1bit是L0,第2bit到第8bit是L1,第9bit到第13bit是L2,第14bit到第18bit是L3;第一层的最后14bit即为GA1、GA2、GB1、GB2,其中第67bit到第69bit是GA1,第70bit到第72bit是GA2,第73bit到第76bit是GB1,第77bit到第80bit是GB2;A2、窄带LSP重建LSP重建单元(121)接收窄带码流分离单元(11)分离出的L0、L1、L2、L3,并通过码书搜索得到窄带的LSP,具体实现步骤如下:A21、LSP量化系数重建LSP量化系数重建单元(1211)根据L0、L1、L2、L3解析出LSP的量化输出
具体实现如下:l ^ i = L 1 i ( L 1 ) + L 2 i ( L 2 ) i = 1 , · · · , 5 L 1 i ( L 1 ) + L 3 i - 5 ( L 3 ) i = 6 , · · · , 10 - - - ( 1 ) ]]> 其中L1是10维的2bit码书,L2、L3是5维的5bit码书;A22、LSP量化系数重置LSP量化系数重置单元(1212)根据LSP量化系数重建单元(1211)输出的LSP量化输出,完成LSP量化系数的重置,具体实现如下:式(1)中的循环变量i取值范围从2到10,每次增加1;每次循环中执行:若满足l ^ i - 1 > l ^ i - J ]]> 条件,则执行l ^ i - 1 = ( l ^ i + l ^ i - 1 - J ) / 2 , ]]>l ^ i = ( l ^ i + l ^ i - 1 + J ) / 2 ]]> 操作;LSP量化系数重置单元(1212)共执行上述循环两次,其中第一次循环时令J=0.0012,第二次循环时令J=0.0006;A23、当前帧LSP量化系数重建当前帧LSP量化系数重建单元(1213)根据LSP量化系数内插单元输出的内插后的LSP系数,重建出当前m帧的LSP量化系数qim,具体实现如下:q ^ i m = ( 1 - Σ n = 1 4 p ^ i , n ) l ^ i m + Σ n = 1 4 p ^ i , n l ^ i m - n i = 1 , · · · , 10 - - - ( 2 ) ]]> 其中,当m<0时![]()
为滑动平均预测器的系数,可以由L0码书搜索得到;A24、当前帧LSP系数滤波当前帧LSP系数滤波单元根据当前帧LSP量化系数重建单元(1213)输出的当前帧的LSP量化系数
滤波操作,具体实现如下:A241、按照i的升序排列
A242、如果q ^ i < 0.005 , ]]> 则q ^ i = 0.005 ; ]]> A243、如果q i + 1 ^ - q i ^ - 0.0391 < 0 , ]]> 则q i + 1 ^ = q i ^ + 0.0391 , ]]> i=1,…,9;A244、如果q 10 ^ > 3.135 , ]]> 则q 10 ^ = 3.135 ; ]]> A3、反射系数重建A31、线性预测系数重建LSP到线性预测系数转换单元根据谱包络重建单元输出的当前帧的LSP系数,完成线性预测系数的重建工作;A311、不同于A22循环变量的循环变量i取值范围从1到5,每次增加1;每次变量i循环时①f1(i)=-2q2i-1f1(i-1)+2f1(i-2);②循环变量j取值范围从i-1到1,每次循环变量j循环时,执行f1[i]=f1[i-1](j)-2q2i-1f1[i-1](j-1)+f1[i-1](j-2)操作;其中,f1(0)=1,f1(-1)=0;将q2i-1替换成q2i即可得到f2(i);A312、f 1 ` = f 1 ( i ) + f 1 ( i - 1 ) i = 1 , . . . , 5 f 2 ` = f 2 ( i ) - f 2 ( i - 1 ) i = 1 , . . . , 5 - - - ( 3 ) ]]> A313、a i = 05 f 1 ` ( i ) + 0.5 f 2 ` ( i ) i = 1 , . . . , 5 0.5 f 1 ` ( 11 - i ) - 0.5 f 2 ` ( 11 - i ) i = 6 , . . . , 10 - - - ( 4 ) ]]> A32、反射系数重建线性预测系数到反射系数转换单元(1222)根据LSP转换成线性预测系数单元(1221)输出的线性预测系数ai,完成反射系数ki的重建,具体实现如下:A321、a m ( m ) = - k m ; ]]> A322、a m - 1 ( i ) = [ a m i + k m a m ( m - i ) ] / ( 1 - k i ) ; ]]> 其中,m=10,9,…,1,i=1,2,…,m-1,
A4、残差能量计算A41、自适应码书增益解析自适应码书增益解析单元(1232)根据宽带码流分离单元(21)分离出的GA1,GB1,解析出固定码书增益,具体实现如下:g ^ p = yA 1 ( GA 1 ) + yB 1 ( GB 1 ) - - - ( 5 ) ]]> A42、固定码书增益解析固定码书增益解析单元(1231)根据宽带码流分离单元(21)分离出的GA2,GB2,解析出固定码书增益,具体实现如下:g ^ c = g ` c ^ ( yA 2 ( GA 2 ) + yB 2 ( GB 2 ) ) - - - ( 6 ) ]]> 其中
是预测的固定码书增益,yA1和yA2是3bit、2维的码书,yB1和yB2是4bit、2维的码书;A43、残差能量计算残差能量计算单元(1233)根据自适应码书增益解析单元(1232)输出的自适应码书增益和固定码书增益解析单元(1231)输出的固定码书增益计算第i帧的残差能量Ei,具体实现如下:E i = ( g p ^ ) 2 + ( g ^ c ) 2 - - - ( 7 ) ]]> B、码书映射码书映射单元(14)将每一窄带语音帧LSP扩展到高频语音帧时域包络及频域包络,具体方法如下:码书映射单元(14)将窄带语音码流解码得到的窄带语音帧LSP进行低频码书搜索,得到其码字所在的行号,并在高频码书中输出此行的数据作为对应的高频时域包络及频域包络;所述的码字指码书的一行;所述的码书是将每一语音帧的k个特征参数做为一个1×k维矢量,将一段语音的多个语音帧的特征矢量分成n类并求每一类的1×k维的质心矢量,n个质心矢量按行排列即得到该段语音的对应的码书,每个质心矢量即为一个码字;所述的码书搜索是将窄带码流解码得到的窄带语音帧谱包络数据作为输入矢量与码书中的每个码字求差的平方,找出与输入向量误差最小的码字,用此码字代替输入向量并输出码字所在行即索引号;C、窄带能量计算窄带能量计算单元(13)根据窄带码流解析单元(12)得到的反射系数ki,i=1,2,…,10以及第i帧的残差能量Ei计算第i帧的窄带能量
具体实现如下:E x i = E i Π i = 1 10 ( 1 - k i 2 ) - - - ( 8 ) ]]> D、函数映射函数映射单元(15)将窄带能量计算单元(13)计算得的窄带语音的能量,作为映射函数的输入,所得到的函数值即为所对应的高频部分能量;E、编码E1、高频能量编码高频能量编码单元(17)完成函数映射单元(15)映射出的高频能量MT的编码,具体为:在对数域以3dB为步长对MT实现5bit量化,得到编码后的高频能量码流;E2、高频包络编码E21、高频能量解码高频能量解码单元(19)将高频能量编码单元(17)输出的高频能量码流解码,得到编码前量化后的高频能量
E22、时域包络去直流分量时域包络去直流分量单元(161)利用高频能量解码单元(19)输出的高频能量
完成高频时域包络的去直流分量工作,具体实现如下:T env M ( i ) = T env ( i ) - M ^ T , i = 0 , · · · , 15 - - - ( 9 ) ]]> 其中,Tenv(i)为去直流分量前的时域包络,
为去直流分量后的时域包络;E23、频域包络去直流分量频域包络去直流分量单元(162)利用高频能量解码单元(19)输出的高频能量
高频能量
完成高频频域包络的去直流分量工作,具体实现如下:F env M ( i ) = F env ( i ) - M ^ T , i = 0 , · · · , 11 - - - ( 10 ) ]]> 其中,Fenv(i)为去直流分量前的频域包络,
为去直流分量后的频域包络;E24、时域包络2分裂时域包络2分裂单元(163)将去直流分量后的时域包络分裂成两个8维的矢量,具体实现如下:T env , 1 = ( T env M ( 0 ) , T env M ( 1 ) , . . . , T env M ( 7 ) ) T env , 2 = ( T env M ( 8 ) , T env M ( 9 ) , . . . , T env M ( 15 ) ) - - - ( 11 ) ]]> E25、频域包络3分裂频域包络3分裂单元(164)将去直流分量后的频域包络分裂成三个4维的矢量,具体实现如下:F env , 1 = ( F env M ( 0 ) , F env M ( 1 ) , F env M ( 2 ) , F env M ( 3 ) ) F env , 2 = ( F env M ( 4 ) , F env M ( 5 ) , F env M ( 6 ) , F env M ( 7 ) ) F env , 3 = ( F env M ( 8 ) , F env M ( 9 ) , F env M ( 10 ) , F env M ( 11 ) ) - - - ( 12 ) ]]> E26、时域包络编码单元(165)时域包络编码单元(165)将时域谱包络2分裂单元的输出的两个8维矢量都用7bit进行量化,得到编码后时域包络码流;E27、频域包络编码单元(166)频域包络编码单元(166)将频域包络3分裂单元(164)的输出的Fenv,1,Fenv,3都用5bit进行量化,Fenv,3用4bit进行量化,得到编码后频域包络码流;F、码流合成码流合成单元(18)将已有的窄带码流和编码单元编码所得到的高频码流按照G.729.1的码流格式填充到码流的Layer3合成宽带码流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310033941.0/,转载请声明来源钻瓜专利网。