[发明专利]一种窄带码流转换为宽带码流的转换方法有效
申请号: | 201310033941.0 | 申请日: | 2012-01-17 |
公开(公告)号: | CN103093757A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 陈喆;殷福亮;李文月 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G10L19/07 | 分类号: | G10L19/07;G10L19/13 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李洪福 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 窄带 流转 宽带 转换 方法 | ||
1.一种窄带码流转换为宽带码流的转换方法,其特征在于:在进行窄带码流到宽带码流的在线转换之前,对于工作语种需要且仅需要一次“离线”建立转换时所需要的映射关系,即进行窄带码流转换成宽带码流时所需转换关系的训练;在完成训练后再进行窄带码流转换成宽带码流,具体包括以下步骤:
A、窄带码流解析
A1、窄带码流分离
窄带码流分离单元(11)将接收到的窄带码流前18bit分离出来,即为L0、L1、L2、L3,其中第1bit是L0,第2bit到第8bit是L1,第9bit到第13bit是L2,第14bit到第18bit是L3;第一层的最后14bit即为GA1、GA2、GB1、GB2,其中第67bit到第69bit是GA1,第70bit到第72bit是GA2,第73bit到第76bit是GB1,第77bit到第80bit是GB2;
A2、窄带LSP重建
LSP重建单元(121)接收窄带码流分离单元(11)分离出的L0、L1、L2、L3,并通过码书搜索得到窄带的LSP,具体实现步骤如下:
A21、LSP量化系数重建
LSP量化系数重建单元(1211)根据L0、L1、L2、L3解析出LSP的量化输出具体实现如下:
其中L1是10维的2bit码书,L2、L3是5维的5bit码书;
A22、LSP量化系数重置
LSP量化系数重置单元(1212)根据LSP量化系数重建单元(1211)输出的LSP量化输出,完成LSP量化系数的重置,具体实现如下:
式(1)中的循环变量i取值范围从2到10,每次增加1;每次循环中执行:若满足
LSP量化系数重置单元(1212)共执行上述循环两次,其中第一次循环时令J=0.0012,第二次循环时令J=0.0006;
A23、当前帧LSP量化系数重建
当前帧LSP量化系数重建单元(1213)根据LSP量化系数内插单元输出的内插后的LSP系数,重建出当前m帧的LSP量化系数qim,具体实现如下:
A24、当前帧LSP系数滤波
当前帧LSP系数滤波单元根据当前帧LSP量化系数重建单元(1213)输出的当前帧的LSP量化系数滤波操作,具体实现如下:
A241、按照i的升序排列
A242、如果
A243、如果
A244、如果
A3、反射系数重建
A31、线性预测系数重建
LSP到线性预测系数转换单元根据谱包络重建单元输出的当前帧的LSP系数,完成线性预测系数的重建工作;
A311、不同于A22循环变量的循环变量i取值范围从1到5,每次增加1;
每次变量i循环时
①f1(i)=-2q2i-1f1(i-1)+2f1(i-2);
②循环变量j取值范围从i-1到1,每次循环变量j循环时,执行f1[i]=f1[i-1](j)-2q2i-1f1[i-1](j-1)+f1[i-1](j-2)操作;
其中,f1(0)=1,f1(-1)=0;将q2i-1替换成q2i即可得到f2(i);
A312、
A313、
A32、反射系数重建
线性预测系数到反射系数转换单元(1222)根据LSP转换成线性预测系数单元(1221)输出的线性预测系数ai,完成反射系数ki的重建,具体实现如下:
A321、
A322、
其中,m=10,9,…,1,i=1,2,…,m-1,
A4、残差能量计算
A41、自适应码书增益解析
自适应码书增益解析单元(1232)根据宽带码流分离单元(21)分离出的GA1,GB1,解析出固定码书增益,具体实现如下:
A42、固定码书增益解析
固定码书增益解析单元(1231)根据宽带码流分离单元(21)分离出的GA2,GB2,解析出固定码书增益,具体实现如下:
其中是预测的固定码书增益,yA1和yA2是3bit、2维的码书,yB1和yB2是4bit、2维的码书;
A43、残差能量计算
残差能量计算单元(1233)根据自适应码书增益解析单元(1232)输出的自适应码书增益和固定码书增益解析单元(1231)输出的固定码书增益计算第i帧的残差能量Ei,具体实现如下:
B、码书映射
码书映射单元(14)将每一窄带语音帧LSP扩展到高频语音帧时域包络及频域包络,具体方法如下:
码书映射单元(14)将窄带语音码流解码得到的窄带语音帧LSP进行低频码书搜索,得到其码字所在的行号,并在高频码书中输出此行的数据作为对应的高频时域包络及频域包络;
所述的码字指码书的一行;所述的码书是将每一语音帧的k个特征参数做为一个1×k维矢量,将一段语音的多个语音帧的特征矢量分成n类并求每一类的1×k维的质心矢量,n个质心矢量按行排列即得到该段语音的对应的码书,每个质心矢量即为一个码字;所述的码书搜索是将窄带码流解码得到的窄带语音帧谱包络数据作为输入矢量与码书中的每个码字求差的平方,找出与输入向量误差最小的码字,用此码字代替输入向量并输出码字所在行即索引号;
C、窄带能量计算
窄带能量计算单元(13)根据窄带码流解析单元(12)得到的反射系数ki,i=1,2,…,10以及第i帧的残差能量Ei计算第i帧的窄带能量具体实现如下:
D、函数映射
函数映射单元(15)将窄带能量计算单元(13)计算得的窄带语音的能量,作为映射函数的输入,所得到的函数值即为所对应的高频部分能量;
E、编码
E1、高频能量编码
高频能量编码单元(17)完成函数映射单元(15)映射出的高频能量MT的编码,具体为:在对数域以3dB为步长对MT实现5bit量化,得到编码后的高频能量码流;
E2、高频包络编码
E21、高频能量解码
高频能量解码单元(19)将高频能量编码单元(17)输出的高频能量码流解码,得到编码前量化后的高频能量
E22、时域包络去直流分量
时域包络去直流分量单元(161)利用高频能量解码单元(19)输出的高频能量完成高频时域包络的去直流分量工作,具体实现如下:
其中,Tenv(i)为去直流分量前的时域包络,为去直流分量后的时域包络;
E23、频域包络去直流分量
频域包络去直流分量单元(162)利用高频能量解码单元(19)输出的高频能量高频能量完成高频频域包络的去直流分量工作,具体实现如下:
其中,Fenv(i)为去直流分量前的频域包络,为去直流分量后的频域包络;
E24、时域包络2分裂
时域包络2分裂单元(163)将去直流分量后的时域包络分裂成两个8维的矢量,具体实现如下:
E25、频域包络3分裂
频域包络3分裂单元(164)将去直流分量后的频域包络分裂成三个4维的矢量,具体实现如下:
E26、时域包络编码单元(165)
时域包络编码单元(165)将时域谱包络2分裂单元的输出的两个8维矢量都用7bit进行量化,得到编码后时域包络码流;
E27、频域包络编码单元(166)
频域包络编码单元(166)将频域包络3分裂单元(164)的输出的Fenv,1,Fenv,3都用5bit进行量化,Fenv,3用4bit进行量化,得到编码后频域包络码流;
F、码流合成
码流合成单元(18)将已有的窄带码流和编码单元编码所得到的高频码流按照G.729.1的码流格式填充到码流的Layer3合成宽带码流。
2.根据权利要求1所述的一种窄带码流转换为宽带码流的转换方法,其特征在于:所述的窄带码流转换成宽带码流时所需转换关系的训练方法,包括以下步骤:
G1、码书映射关系的训练
映射码书训练单元(23)在扩展单元(1)工作之前先对一帧数为LEN、时长为180分钟的宽带语音码流样本经宽带码流解析单元(22)部分解码得到低频LSP和对应的高频时域包络以及频域包络,然后经低频LSP和高频时域包络及频域包络矢量组合单元(231)、矢量分类单元(232)以及码书生成单元(233)生成码书映射单元(14)所需要的两个一一对应的低频码书和高频码书;
G11、宽带码流分离
宽带码流分离单元(21)将G.729.1的宽带码流每20毫秒帧中两个10毫秒帧第一层的前18bit分离出来即为L0、L1、L2、L3,其中第1bit是L0,第2bit到第8bit是L1,第9bit到第13bit是L2,第14bit到第18是L3;第一层的最后14bit即为GA1、GA2、GB1、GB2,其中第67bit到第69bit是GA1,第70bit到第72bit是GA2,第73bit到第76bit是GB1,第77bit到第80bit是GB2;每20ms帧第三层的前5bit分离出来即为MU,第6bit到第12bit即为T1,第13bit到第18bit即为T2,第19bit到第23bit即为F1,第24bit到第28bit即为F2,第29bit到第32bit即为F3;
G12、低频码流解析
低频码流解析单元(221)对宽带码流分离单元(21)分离出的低频码流进行解析,解析方法同步骤A;
G13、高频码流解析
G131、高频能量解析
高频能量解析单元(2222)将宽带码流分离单元(21)分离出的MU码字解码得到高频能量
G132、高频时域及频域包络解析
高频时域包络及频域包络解析单元(2221)接收宽带码流分离单元(21)分离出的高频谱包络码字T1、T2、F1、F2、F3,并到相应的码书中查找相应的矢量其中
并根据高频能量解析单元(2222)解析得到高频能量对高频时域包络及频域包络码流进行解码,得到解码后的高频时域包络(i=0,1,…,15)和频域包络(j=0,1,…,11),具体实现步骤如下:
G14、低频LSP和高频时及频域包络矢量组合
低频LSP和高频时域及频域包络矢量组合单元分别将宽带码流解析单元(22)解析出的每一语音帧的10维LSP、16维时域包络以及12维的频域包络按照先是10维LSP,再是16维时域包络
G15、矢量分类
矢量分类单元(232)采用动态聚类的方法将低频LSP和高频时域包络及频域包络矢量组合单元(231)的输出的总数为LEN个的38维矢量,以10维的低频LSP作为聚类对象进行分类,得到矢量分类的结果;
G16、码书生成
码书生成单元(233)分别利用算术求平均的方法和加权求平均的方法求取前10维LSP的质心矢量以及后28维高频时域包络及频域包络的质心矢量,具体实现如下:
G161、低频码书生成
低频码书生成单元(2331)利用算术求平均的方法,分别计算矢量分类结果中每一类的前10维矢量LSP的均值,所求得的结果即为该类质心矢量,将每一类的质心矢量按行排列即得到低频码书;
G162、高频码书生成
高频码书生成单元(2332)利用加权求平均的方法,计算矢量分类单元(232)输出的分类结果中每一类的后28维时域包络及频域包络质心矢量;先是利用算术求平均的方法分别求出每一类所有矢量的均值作为该类的初始质心矢量,然后求出每一个矢量与所在类质心矢量的距离,再用加权求质心的方法求出新质心,判断初始质心的1范数与新质心的1范数相对差的绝对值是否满足门限要求,若不满足则令新质心为初始质心,再用相同加权求质心的算法求出新质心,依次迭代直到二者1范数相对差的绝对值满足门限要求时退出迭代,并将此质心作为此类的质心;将所有类的质心矢量按行排列得到与低频码书一一对应的高频码书;具体实现方法如下:
G1621、初始质心矢量计算
初始质心矢量计算单元(23321)先利用简单算术求平均的方法,计算矢量分类单元(2232)输出的分类结果中每一类的后28维高频时及频域包络初始质心,计算公式如下:
在此计算公式中,n为某一类中的矢量数目,x[j][k]表示第j个高频时域包络及频域包络矢量,ind[j]表示矢量x[j][k]所在的类,aver0[ind[j]][k]表示第ind[j]类的初始质心矢量;
G1622、矢量与其所在类质心矢量距离的计算
矢量与其所在类质心矢量距离的计算单元(23322)分别求出每一矢量与所在类质心矢量的距离,计算公式如下:
在此计算公式中dist[j]表示x[j][k]与所在类质心矢量的距离;
G1623、新质心矢量计算
新质心矢量计算单元(23323)用加权求平均的方法求出新质心矢量,计算公式如下:
在该单元中w[i]表示该类中所用矢量与质心矢量距离倒数的和;aver[i][k]表示第i类的新质心矢量;
G1624、新质心和初始质心矢量1范数计算
新质心矢量和初始质心矢量1范数计算单元(23324)计算新质心矢量和初始质心矢量之间的1范数,计算公式如下:
sum0和sum分别表示初始质心矢量和新质心矢量的1范数;
G1625、判断
判断单元(23325)判断初始质心的1范数与新质心的1范数相对差的绝对值是否满足门限要求,计算公式如下:
当门限要求不满足时,令aver0[i][k]=aver[i][k],并重复步骤G1622-G1625,直到所有分类的质心矢量都满足门限要求时,不再重复,此时的质心矢量即为分类的质心矢量,这些质心矢量组成高频码书;
G2、能量映射函数关系的训练
能量映射函数训练单元(24)接收低频码流解析单元(221)输出的第i语音帧的低频能量和高频码流解析单元(222)输出的高频能量利用最小二乘法拟合出总数为LEN帧的高低频能量之间的函数关系具体实现步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310033941.0/1.html,转载请声明来源钻瓜专利网。