[发明专利]一种低码率语音编码器以及解码器有效

申请号：	201310732544.2	申请日：	2013-12-26
公开（公告）号：	CN103854655B	公开（公告）日：	2016-10-19
发明（设计）人：	江文斌;郭栗;曹一鸣;刘佩林	申请（专利权）人：	上海交通大学
主分类号：	G10L19/16	分类号：	G10L19/16
代理公司：	上海汉声知识产权代理有限公司 31236	代理人：	胡晶
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种低码率语音编码器以及解码器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种语音编码器以及解码器，尤其涉及一种基于梅尔倒谱系数的低码率语音编码器以及解码器。

背景技术

低码率语音编解码器主要是指码率低于4.8kbps、采用参数编码的语音编码器，其广泛应用于信道带宽受限的卫星通信和军用保密通信。上世纪八十年代，美国国防部制定了首个2.4kbps的低码率语音通信编码标准FS-1015LPC-10e。该编码器基于语音信号的产生模型，采用清浊音二元激励一个自适应滤波器（即LPC滤波器）产生语音信号。1991年，又制定了4.8kbps的FS-1016标准CELP(Code Excited Linear Prediction)。该编码器采用码本作为激励源并通过LPC滤波器合成抗噪性能更好、可懂度更高的语音信号。1997年，由美国德州仪器公司推出的MELP(Mixed Excitation Linear Prediction)语音编码器代替了FS-1015标准的LPC-10e声码器成为2.4kbps低码率语音通信新标准。该编码器奖激励信号分为清音、浊音和抖动音三种状态，吸收多带激励编码的优点将信号分成5个子频带分别进行清浊音判决，改进基音提取算法，清浊音分类的最小二乘估计-幅度谱逼近语音重建方法。经典的最小二乘估计-幅度谱逼近信号估计方法能在信号相位谱未知的情况下通过迭代的方法根据幅度谱估计出信号的时域波形。但该方法的最大缺点是将信号初始化为随机噪声信号，这导致估计得到的信号不稳定。

语音编解码器中最为关键的部分是语音重建/合成算法，在传统的低码率语音编码器中，一般采用语音的线性预测模型，如LPC-10e、CELP、MELP等,此种方法将非人耳听觉范围内的冗余信息一同进行处理，浪费了资源。传统的低码率语音编码器一般需要计算清浊音和基音信息并发送到解码器，编码器的算法复杂，量化传输的参数量也更多，解码器的重建算法对清浊音帧采用不同的方法进行语音合成。

近年来，语音识别系统广泛应用于手持终端设备。梅尔倒谱为一种基于人耳听觉特性的倒谱，梅尔倒谱系数MFCC,（Mel Frequency Cepstrum Coefficient)，作为语音识别的主要特征参数。有研究者根据语音信号倒谱与基音频率之间的相关性，提出采用混合高斯模型(Gaussian Mixture Model,GMM)和隐马可夫模型(Hidden Markov Model,HMM)对基音周期和清浊音判决信息进行估计预测，然后采用DSR的语音重建算法恢复出语音信号，因而，研究出一种基于梅尔倒谱系数的低码率语音编码器以及解码器，减少对冗长不必要语音信息的编码与解码是十分紧要的。

发明内容

本发明的目的在于提供一种低码率的语音编码器以及解码器，采用基于人耳听觉模型的梅尔倒谱系数作为编解码参数，使得编解码器可以有效去除非人耳听觉范围内的冗余信息。

为了实现上述目的，本发明提供了一种低码率的语音编码器，包括：

语音信号预处理模块，接收原始语音信号，进行加窗分帧和滤除低频的干扰信号；

梅尔倒谱系数提取模块，对预处理后的语音信号处理，输出梅尔倒谱系数MFCC；以及参数量化模块，对MFCC进行量化。

较佳地，所述梅尔倒谱系数提取模块依次包括：

预增强处理模块，为一阶有限激励响应高通滤波器，输入预处理后的语音信号；快速傅里叶变换模块，计算预增强处理后的语音信号的幅度谱；

梅尔滤波模块，在梅尔倒谱域计算幅度谱在梅尔三角窗内的加权求和值；

非线性变换模块，将所述梅尔滤波模块输出端信号的幅度谱变换到对数域；以及

离散余弦变换模块，输入所述非线性变换模块的输出信号，并进行离散傅里叶变化得到MFCC。

较佳地，对MFCC的第一个参数采用非均匀标量量化，其余参数采用矢量量化。

较佳地，2400bps或1200bps码率的语音信号帧间重叠为25%，600bps或300bps码率的语音信号帧间重叠为0%