[发明专利]一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法有效

申请号：	201510434127.9	申请日：	2015-07-22
公开（公告）号：	CN105118513B	公开（公告）日：	2018-12-28
发明（设计）人：	李强;付余涛;舒勤军;陈丁当;陈浩;朱兰;明艳;夏绪玖	申请（专利权）人：	重庆邮电大学
主分类号：	G10L19/087	分类号：	G10L19/087
代理公司：	重庆市恒信知识产权代理有限公司 50102	代理人：	刘小红
地址：	400065 ***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明请求保护一种基于MELP的1.2kb/s低速率语音编解码方法，包括：编码端首先对语音信号以30ms为子帧长度进行分帧处理，将相邻两子帧组成一个超帧，对提取的语音特征参数LSF、Pitch、VP、Fsmag和G进行多帧联合量化编码。利用帧结构中剩余比特对重要的语音特征参数进行差错控制编码，最后组成二进制比特流进行传送。解码端从接收到的比特流中解析出各语音特征参数的量化索引值，通过量化索引得到语音特征参数的初值，然后进行语音特征参数完整性重构，利用重构的语音特征参数生成激励信号，再经过自适应谱增强、合成滤波器、增益控制和散布脉冲滤波后得到合成的语音信号。本发明能有效地降低语音编码速率，接收端合成的语音具有较高的清晰度和可懂度。
搜索关键词：	一种基于混合激励线性预测 melp 1.2 kb 速率语音解码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法，其特征在于，包括编码端的编码步骤及解码端的解码步骤，其中编码端的编码步骤具体为：101、在编码端，根据编码器的输出码率和处理帧的长度计算出编码帧长，确定语音特征参数，包括线谱对频率LSF、基音周期Pitch、增益G、非周期标志、残差谐波幅度Fsmag、带通清/浊音强度VP量化所用的比特数，设计出编码帧结构；102、输入语音信号，首先对输入的语音信号进行预处理，滤除工频干扰信号，截取M1长度的语音信号为一子帧，两个子帧组成一个超帧，M1表示语音信号的长度；103、设计编码数据缓存器结构，确定分析语音特征参数所用的窗函数的中心位置；104、采用步骤103中确定的窗函数对语音信号进行截断处理后，提取子帧的语音特征参数，以超帧为单位，对语音特征参数进行联合量化，具体为：将超帧的语音特征参数按分配的比特数进行标量量化或矢量量化，包括步骤：A1、提取子帧的基音周期Pitch，经对数化后进行7bit标量量化；A2、判断子帧的清音/浊音(U/V)状态，如果为清音子帧，则不提取清/浊音强度VP值；如果是浊音子帧，则提取清/浊音强度VP值。对浊音子帧进行分带处理，浊音子帧通过带通滤波器后分为5个子带，如果子带为清音状态，用“0”表示，如果子带为浊音状态，用“1”表示。对浊音子帧的后4个子带的带通清/浊音强度VP用2bit量化，即：将0001、0010、0011、0100、0101归入0000，用00编码；将1001，1010，1011归入1000，用01编码；将1101归入1100，用10编码；将1110，0111，0110归入1111，用11编码；A3、提取每子帧的增益G，用8bit进行标量量化；A4、提取超帧中第一个浊音子帧的残差谐波幅度Fsmag值，进行8bit矢量量化。对清音子帧不提取Fsmag值；A5、对提取子帧的线谱对频率LSF分模式进行量化，当两子帧分别为浊音清音或清音浊音时，浊音子帧和清音子帧的LSF分别采用19bit和10bit矢量量化；当两子帧均为清音时，两子帧的LSF都采用10bit进行矢量量化；当两子帧均为浊音时，第一子帧的LSF1采用19bit矢量量化，利用LSF1对第二子帧的LSF2进行预测，得到预测值计算LSF2的残差信号然后对残差值ΔLSF2做8bit矢量量化；105、利用编码后超帧结构中的剩余比特将步骤104所得的重要参数进行差错控制编码，组成二进制比特流后，传送给解码端；在解码端，解码端的解码步骤为：106、解码端接收编码端发送来的比特流，并从接收到的比特流中解析出各语音特征参数的量化索引值，通过量化索引得到语音特征参数的初值，然后进行语音特征参数完整性重构；107、根据步骤106解析出的基音周期Pitch值判断该子帧的清/浊状态。若为浊音子帧时，利用残差谐波幅度Fsmag和带通清/浊音强度VP生成周期性脉冲激励信号；如果为清音子帧，激励为白噪声信号。激励信号经过合成滤波器后，得到重构的语音信号；108、对重构的语音信号进行增益调整和脉冲散布滤波，得到最终合成的语音信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆邮电大学，未经重庆邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510434127.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法有效

专利文献下载