[发明专利]一种窄带码流转换为宽带码流的转换方法有效
申请号: | 201310033941.0 | 申请日: | 2012-01-17 |
公开(公告)号: | CN103093757A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 陈喆;殷福亮;李文月 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G10L19/07 | 分类号: | G10L19/07;G10L19/13 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种窄带码流转换为宽带码流的转换方法,所述的装置包括扩展单元和训练单元,所述的扩展单元包括窄带码流分离单元、窄带码流解析单元、窄带能量计算单元、码书映射单元、函数映射单元、高频时域包络及频域包络编码单元、高频能量编码单元、码流合成单元以及高频能量解码单元。所述的方法包括以下步骤:窄带码流解析;码书映射;窄带能量计算;函数映射;编码和码流合成。本发明第一次实现了将G.729编码得到的窄带码流扩展成可以作为G.729.1解码器输入的宽带码流,可以直接将现有电话通信网络传来的窄带码流直接通过G.729.1解码输出得到宽带语音,实现了宽带终端对窄带终端的兼容。 | ||
搜索关键词: | 一种 窄带 流转 宽带 转换 方法 | ||
【主权项】:
1.一种窄带码流转换为宽带码流的转换方法,其特征在于:在进行窄带码流到宽带码流的在线转换之前,对于工作语种需要且仅需要一次“离线”建立转换时所需要的映射关系,即进行窄带码流转换成宽带码流时所需转换关系的训练;在完成训练后再进行窄带码流转换成宽带码流,具体包括以下步骤:A、窄带码流解析A1、窄带码流分离窄带码流分离单元(11)将接收到的窄带码流前18bit分离出来,即为L0、L1、L2、L3,其中第1bit是L0,第2bit到第8bit是L1,第9bit到第13bit是L2,第14bit到第18bit是L3;第一层的最后14bit即为GA1、GA2、GB1、GB2,其中第67bit到第69bit是GA1,第70bit到第72bit是GA2,第73bit到第76bit是GB1,第77bit到第80bit是GB2;A2、窄带LSP重建LSP重建单元(121)接收窄带码流分离单元(11)分离出的L0、L1、L2、L3,并通过码书搜索得到窄带的LSP,具体实现步骤如下:A21、LSP量化系数重建LSP量化系数重建单元(1211)根据L0、L1、L2、L3解析出LSP的量化输出具体实现如下:l ^ i = L 1 i ( L 1 ) + L 2 i ( L 2 ) i = 1 , · · · , 5 L 1 i ( L 1 ) + L 3 i - 5 ( L 3 ) i = 6 , · · · , 10 - - - ( 1 ) ]]> 其中L1是10维的2bit码书,L2、L3是5维的5bit码书;A22、LSP量化系数重置LSP量化系数重置单元(1212)根据LSP量化系数重建单元(1211)输出的LSP量化输出,完成LSP量化系数的重置,具体实现如下:式(1)中的循环变量i取值范围从2到10,每次增加1;每次循环中执行:若满足l ^ i - 1 > l ^ i - J ]]> 条件,则执行l ^ i - 1 = ( l ^ i + l ^ i - 1 - J ) / 2 , ]]>l ^ i = ( l ^ i + l ^ i - 1 + J ) / 2 ]]> 操作;LSP量化系数重置单元(1212)共执行上述循环两次,其中第一次循环时令J=0.0012,第二次循环时令J=0.0006;A23、当前帧LSP量化系数重建当前帧LSP量化系数重建单元(1213)根据LSP量化系数内插单元输出的内插后的LSP系数,重建出当前m帧的LSP量化系数qim,具体实现如下:q ^ i m = ( 1 - Σ n = 1 4 p ^ i , n ) l ^ i m + Σ n = 1 4 p ^ i , n l ^ i m - n i = 1 , · · · , 10 - - - ( 2 ) ]]> 其中,当m<0时为滑动平均预测器的系数,可以由L0码书搜索得到;A24、当前帧LSP系数滤波当前帧LSP系数滤波单元根据当前帧LSP量化系数重建单元(1213)输出的当前帧的LSP量化系数滤波操作,具体实现如下:A241、按照i的升序排列A242、如果q ^ i < 0.005 , ]]> 则q ^ i = 0.005 ; ]]> A243、如果q i + 1 ^ - q i ^ - 0.0391 < 0 , ]]> 则q i + 1 ^ = q i ^ + 0.0391 , ]]> i=1,…,9;A244、如果q 10 ^ > 3.135 , ]]> 则q 10 ^ = 3.135 ; ]]> A3、反射系数重建A31、线性预测系数重建LSP到线性预测系数转换单元根据谱包络重建单元输出的当前帧的LSP系数,完成线性预测系数的重建工作;A311、不同于A22循环变量的循环变量i取值范围从1到5,每次增加1;每次变量i循环时①f1(i)=-2q2i-1f1(i-1)+2f1(i-2);②循环变量j取值范围从i-1到1,每次循环变量j循环时,执行f1[i]=f1[i-1](j)-2q2i-1f1[i-1](j-1)+f1[i-1](j-2)操作;其中,f1(0)=1,f1(-1)=0;将q2i-1替换成q2i即可得到f2(i);A312、f 1 ` = f 1 ( i ) + f 1 ( i - 1 ) i = 1 , . . . , 5 f 2 ` = f 2 ( i ) - f 2 ( i - 1 ) i = 1 , . . . , 5 - - - ( 3 ) ]]> A313、a i = 05 f 1 ` ( i ) + 0.5 f 2 ` ( i ) i = 1 , . . . , 5 0.5 f 1 ` ( 11 - i ) - 0.5 f 2 ` ( 11 - i ) i = 6 , . . . , 10 - - - ( 4 ) ]]> A32、反射系数重建线性预测系数到反射系数转换单元(1222)根据LSP转换成线性预测系数单元(1221)输出的线性预测系数ai,完成反射系数ki的重建,具体实现如下:A321、a m ( m ) = - k m ; ]]> A322、a m - 1 ( i ) = [ a m i + k m a m ( m - i ) ] / ( 1 - k i ) ; ]]> 其中,m=10,9,…,1,i=1,2,…,m-1,A4、残差能量计算A41、自适应码书增益解析自适应码书增益解析单元(1232)根据宽带码流分离单元(21)分离出的GA1,GB1,解析出固定码书增益,具体实现如下:g ^ p = yA 1 ( GA 1 ) + yB 1 ( GB 1 ) - - - ( 5 ) ]]> A42、固定码书增益解析固定码书增益解析单元(1231)根据宽带码流分离单元(21)分离出的GA2,GB2,解析出固定码书增益,具体实现如下:g ^ c = g ` c ^ ( yA 2 ( GA 2 ) + yB 2 ( GB 2 ) ) - - - ( 6 ) ]]> 其中是预测的固定码书增益,yA1和yA2是3bit、2维的码书,yB1和yB2是4bit、2维的码书;A43、残差能量计算残差能量计算单元(1233)根据自适应码书增益解析单元(1232)输出的自适应码书增益和固定码书增益解析单元(1231)输出的固定码书增益计算第i帧的残差能量Ei,具体实现如下:E i = ( g p ^ ) 2 + ( g ^ c ) 2 - - - ( 7 ) ]]> B、码书映射码书映射单元(14)将每一窄带语音帧LSP扩展到高频语音帧时域包络及频域包络,具体方法如下:码书映射单元(14)将窄带语音码流解码得到的窄带语音帧LSP进行低频码书搜索,得到其码字所在的行号,并在高频码书中输出此行的数据作为对应的高频时域包络及频域包络;所述的码字指码书的一行;所述的码书是将每一语音帧的k个特征参数做为一个1×k维矢量,将一段语音的多个语音帧的特征矢量分成n类并求每一类的1×k维的质心矢量,n个质心矢量按行排列即得到该段语音的对应的码书,每个质心矢量即为一个码字;所述的码书搜索是将窄带码流解码得到的窄带语音帧谱包络数据作为输入矢量与码书中的每个码字求差的平方,找出与输入向量误差最小的码字,用此码字代替输入向量并输出码字所在行即索引号;C、窄带能量计算窄带能量计算单元(13)根据窄带码流解析单元(12)得到的反射系数ki,i=1,2,…,10以及第i帧的残差能量Ei计算第i帧的窄带能量具体实现如下:E x i = E i Π i = 1 10 ( 1 - k i 2 ) - - - ( 8 ) ]]> D、函数映射函数映射单元(15)将窄带能量计算单元(13)计算得的窄带语音的能量,作为映射函数的输入,所得到的函数值即为所对应的高频部分能量;E、编码E1、高频能量编码高频能量编码单元(17)完成函数映射单元(15)映射出的高频能量MT的编码,具体为:在对数域以3dB为步长对MT实现5bit量化,得到编码后的高频能量码流;E2、高频包络编码E21、高频能量解码高频能量解码单元(19)将高频能量编码单元(17)输出的高频能量码流解码,得到编码前量化后的高频能量E22、时域包络去直流分量时域包络去直流分量单元(161)利用高频能量解码单元(19)输出的高频能量完成高频时域包络的去直流分量工作,具体实现如下:T env M ( i ) = T env ( i ) - M ^ T , i = 0 , · · · , 15 - - - ( 9 ) ]]> 其中,Tenv(i)为去直流分量前的时域包络,为去直流分量后的时域包络;E23、频域包络去直流分量频域包络去直流分量单元(162)利用高频能量解码单元(19)输出的高频能量高频能量完成高频频域包络的去直流分量工作,具体实现如下:F env M ( i ) = F env ( i ) - M ^ T , i = 0 , · · · , 11 - - - ( 10 ) ]]> 其中,Fenv(i)为去直流分量前的频域包络,为去直流分量后的频域包络;E24、时域包络2分裂时域包络2分裂单元(163)将去直流分量后的时域包络分裂成两个8维的矢量,具体实现如下:T env , 1 = ( T env M ( 0 ) , T env M ( 1 ) , . . . , T env M ( 7 ) ) T env , 2 = ( T env M ( 8 ) , T env M ( 9 ) , . . . , T env M ( 15 ) ) - - - ( 11 ) ]]> E25、频域包络3分裂频域包络3分裂单元(164)将去直流分量后的频域包络分裂成三个4维的矢量,具体实现如下:F env , 1 = ( F env M ( 0 ) , F env M ( 1 ) , F env M ( 2 ) , F env M ( 3 ) ) F env , 2 = ( F env M ( 4 ) , F env M ( 5 ) , F env M ( 6 ) , F env M ( 7 ) ) F env , 3 = ( F env M ( 8 ) , F env M ( 9 ) , F env M ( 10 ) , F env M ( 11 ) ) - - - ( 12 ) ]]> E26、时域包络编码单元(165)时域包络编码单元(165)将时域谱包络2分裂单元的输出的两个8维矢量都用7bit进行量化,得到编码后时域包络码流;E27、频域包络编码单元(166)频域包络编码单元(166)将频域包络3分裂单元(164)的输出的Fenv,1,Fenv,3都用5bit进行量化,Fenv,3用4bit进行量化,得到编码后频域包络码流;F、码流合成码流合成单元(18)将已有的窄带码流和编码单元编码所得到的高频码流按照G.729.1的码流格式填充到码流的Layer3合成宽带码流。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310033941.0/,转载请声明来源钻瓜专利网。
- 同类专利
- 编码装置、编码方法、记录介质-201580022683.3
- 守谷健弘;镰本优;原田登 - 日本电信电话株式会社
- 2015-03-16 - 2019-11-01 - G10L19/07
- 本发明提供兼用作为以较少的码量高精度地表示可变换为线性预测系数的系数的编码以及解码方法的预测对应的编码以及解码方法;以及只要当前帧的线性预测系数码被正确地输入到解码装置,则可以正确地解码可变换为当前帧的线性预测系数的系数那样的编码以及解码方法兼用的编码方法以及解码方法。编码装置包括:预测对应编码单元,对由可变换为当前的帧的多阶的线性预测系数的系数的向量的、与至少包含来自过去的帧的预测的预测向量的差分所构成的差分向量进行编码,得到第一码,从而得到与第一码对应的量化差分向量;以及非预测对应编码单元,对由可变换为当前的帧的多阶的线性预测系数的系数的向量和量化差分向量的差分或者差分的元素的一部分所构成的校正向量进行编码,生成第二码。
- 基于语音多带激励编码LSP参数的量子压缩方法-201410294051.X
- 梁彦霞;卢光跃;聂敏;杨武军;张美玲;刘原华;何华;刘晓慧;杨光;刘璐;王颖 - 西安邮电大学
- 2014-06-21 - 2017-06-06 - G10L19/07
- 本发明公开了一种基于语音多带激励编码LSP参数的量子压缩方法,涉及编码技术领域。通过参数提取、压缩、排序,将语音的LSP参数转换为经典二进制序列,长度为经典二进制8比特,应用幺正变换U,对不同子空间的输入序列进行变换,发送端对|ψ′〉的第八个比特进行测量,接收端对所接收的信息后面添加|0〉,并进行解压缩操作,将得到的八位态矢对应至经典二进制信息,生成最终的LSP参数,对码本按照选中的参数次数进行排序。本发明利用量子与语音压缩进行结合应用的语音模型多带激励模型,合理的利用各态矢之间的相关性,填补现有技术的空白,满足人们的使用需求。
- 一种获取语音信号的平滑谱的方法和装置-201310207404.3
- 吴小平 - 腾讯科技(深圳)有限公司
- 2013-05-29 - 2014-11-12 - G10L19/07
- 本发明公开了一种获取语音信号的平滑谱的方法和装置:获取待处理的语音信号的各线谱对参数;分别计算各线谱对参数的余弦值;针对各预定频率点,分别计算该预定频率点的余弦值,并根据计算出的该预定频率点的余弦值以及各线谱对参数的余弦值,计算出该预定频率点的平滑谱值;根据计算出的各预定频率点的平滑谱值生成该语音信号的平滑谱。应用本发明所述方案,能够减少计算量和时耗。
- 一种语音线性预测编码模型的缺失值非线性估算方法-201410054042.3
- 马占宇;齐峰;司中威;郭军;张洪刚 - 北京邮电大学
- 2014-02-18 - 2014-05-28 - G10L19/07
- 本发明实施例公开了一种语音线性预测编码模型的缺失值非线性估算方法。该方法包括如下步骤:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;训练模型步骤;传输过程中丢失部分和收到部分概率分布计算步骤;最小均方误差最优化估计步骤。利用本发明实施例,能够在分组传输丢包的情况下,可靠的实现线性预测模型的最优估计,降低传输损失,提高语音质量,具有很大的实用价值。
- 一种窄带码流转换为宽带码流的转换方法-201310033941.0
- 陈喆;殷福亮;李文月 - 大连理工大学
- 2012-01-17 - 2013-05-08 - G10L19/07
- 本发明公开了一种窄带码流转换为宽带码流的转换方法,所述的装置包括扩展单元和训练单元,所述的扩展单元包括窄带码流分离单元、窄带码流解析单元、窄带能量计算单元、码书映射单元、函数映射单元、高频时域包络及频域包络编码单元、高频能量编码单元、码流合成单元以及高频能量解码单元。所述的方法包括以下步骤:窄带码流解析;码书映射;窄带能量计算;函数映射;编码和码流合成。本发明第一次实现了将G.729编码得到的窄带码流扩展成可以作为G.729.1解码器输入的宽带码流,可以直接将现有电话通信网络传来的窄带码流直接通过G.729.1解码输出得到宽带语音,实现了宽带终端对窄带终端的兼容。
- 专利分类