[发明专利]一种低码率语音编码器以及解码器有效

申请号：	201310732544.2	申请日：	2013-12-26
公开（公告）号：	CN103854655B	公开（公告）日：	2016-10-19
发明（设计）人：	江文斌;郭栗;曹一鸣;刘佩林	申请（专利权）人：	上海交通大学
主分类号：	G10L19/16	分类号：	G10L19/16
代理公司：	上海汉声知识产权代理有限公司 31236	代理人：	胡晶
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种低码率语音编码器以及解码器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种低码率语音编码器，其特征在于，包括：

语音信号预处理模块，接收原始语音信号，进行加窗分帧和滤除低频的干扰信号；

梅尔倒谱系数提取模块，对预处理后的语音信号进行处理，输出梅尔倒谱系数MFCC；以及

参数量化模块，对MFCC进行量化。

2.如权利要求1所述的一种低码率音编码器，其特征在于，所述梅尔倒谱系数提取模块依次包括：

预增强处理模块，为一阶有限激励响应高通滤波器，输入预处理后的语音信号；

快速傅里叶变换模块，计算预增强处理后的语音信号的幅度谱；

梅尔滤波模块，在梅尔倒谱域计算幅度谱在梅尔三角窗内的加权求和值；

非线性变换模块，将所述梅尔滤波模块输出端信号的幅度谱变换到对数域；以及

离散余弦变换模块，输入所述非线性变换模块的输出信号，并进行离散傅里叶变化得到MFCC。

3.如权利要求1所述的一种低码率语音编码器，其特征在于，对MFCC的第一个参数采用非均匀标量量化，其余参数采用矢量量化。

4.如权利要求1或3所述的一种低码率语音编码器，其特征在于，所述低码率语音编码器支持2400bps、1200bps、600bps和300bps四种码率，在300bps码率时，采用2帧组成超级帧进行2帧联合矢量量化。

5. 如权利要求4所述的一种低码率语音编码器，其特征在于，2400bps或1200bps码率的语音信号帧间重叠为25%，600bps或300bps码率的语音信号帧间重叠为0%。

6.一种低码率语音解码器，其特征在于，包括：

参数反量化模块，将量化后的MFCC进行反量化，得到量化前的MFCC；

幅度谱重建模块，通过MFCC恢复得到语音信号的幅度谱；

最小相位信号重建模块，根据语音信号的幅度谱得出最小相位信号；

GMM特征提取及参数训练系统，通过对一训练语音信号进行处理，输出基音估计的GMM参数以及清浊音估计的GMM参数；

清浊音估计模块，与所述幅度谱重建模块输出端相连，对重建后的幅度谱采用所述清浊音估计的GMM参数求概率进行估计，与阈值比较进行清浊音判决；

基音估计模块，与所述请浊音估计模块输出端相连，对估计为浊音帧的幅度谱采用所述基音估计的GMM参数进行基音估计；

Rosenberg脉冲产生模块，与所述基音估计模块输出端相连，根据估计出的基音产生Rosenberg脉冲用于模拟语音信号产生声门脉冲；

语音信号重建模块，与所述Rosenberg脉冲产生器模块以及所述最小相位信号重建模块的输出端相连，对清音帧和浊音帧分别进行重建；以及

叠接相加模块，与所述语音信重建模块的输出端相连，将重建后的清音帧和浊音帧进行帧间叠加，得到完整的语音信号。

7. 如权利要求6所述的一种低码率语音解码器，其特征在于，所述低码率语音解码器支持2400bps、1200bps、600bps和300bps四种码率。

8. 如权利要求6所述的一种低码率语音解码器，其特征在于，幅度谱重建模块包括：

离散余弦反变换模块，将MFCC变化为语音信号的对数域；

非线性反变换模块，将语音信号的对数域变换为梅尔滤波后的幅度域；

去梅尔窗模块，将梅尔滤波后的幅度域恢复得到原语音信号的幅度谱。

9. 如权利要求6所述的一种低码率语音解码器，其特征在于，语音信号重建模块中还包括：

清音重建模块，将清音帧的最小相位信号给定为初始值，进行最小二乘估计-幅度谱逼近算法的计算；

浊音重建模块，将浊音帧的去除Rosenberg脉冲激励后的最小激励信号给定为初始值，进行最小二乘估计-幅度谱逼近算法的计算。

10. 如权利要求6所述的一种低码率语音解码器，其特征在于，所述GMM特征提取及参数训练系统中包括：

梅尔倒谱系数提取模块，接收所述训练语音信号，得到其梅尔倒谱系数MFCC；

幅度谱重建模块，连接所述梅尔倒谱系数提取模块的输出端，通过MFCC恢复得到语音信号的幅度谱；

傅里叶变换模块，将所述训练语音信号进行傅里叶变换；

基音提取模块，与所述傅里叶变换模块输出端连接，对压缩滤波后的语音信号进行基音提取；

基音估计特征向量提取模块，连接所述幅度谱重建模块以及所述基音提取模块的输出端，提取出基音估计的特征向量；

基音混合高斯模型GMM参数训练模块，连接所述基音估计特征向量提取模块的输出端，根据基音估计特征向量对基音帧进行训练，得到基音GMM参数；

清浊音估计特征向量提取模块，连接所述傅里叶变换模块输出端，在压缩滤波后的语音信号中提取出清浊音估计的特征向量：

清浊音GMM参数训练模块，连接所述清浊音估计特征向量提取模块输出端，根据清浊音估计特征向量对清浊音帧进行训练，得到清浊音GMM参数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310732544.2/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种低码率语音编码器以及解码器有效

专利文献下载