[发明专利]一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法有效
| 申请号: | 201510434127.9 | 申请日: | 2015-07-22 |
| 公开(公告)号: | CN105118513B | 公开(公告)日: | 2018-12-28 |
| 发明(设计)人: | 李强;付余涛;舒勤军;陈丁当;陈浩;朱兰;明艳;夏绪玖 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G10L19/087 | 分类号: | G10L19/087 |
| 代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
| 地址: | 400065 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明请求保护一种基于MELP的1.2kb/s低速率语音编解码方法,包括:编码端首先对语音信号以30ms为子帧长度进行分帧处理,将相邻两子帧组成一个超帧,对提取的语音特征参数LSF、Pitch、VP、Fsmag和G进行多帧联合量化编码。利用帧结构中剩余比特对重要的语音特征参数进行差错控制编码,最后组成二进制比特流进行传送。解码端从接收到的比特流中解析出各语音特征参数的量化索引值,通过量化索引得到语音特征参数的初值,然后进行语音特征参数完整性重构,利用重构的语音特征参数生成激励信号,再经过自适应谱增强、合成滤波器、增益控制和散布脉冲滤波后得到合成的语音信号。本发明能有效地降低语音编码速率,接收端合成的语音具有较高的清晰度和可懂度。 | ||
| 搜索关键词: | 一种 基于 混合 激励 线性 预测 melp 1.2 kb 速率 语音 解码 方法 | ||
【主权项】:
1.一种基于混合激励线性预测MELP的1.2kb/s低速率语音编解码方法,其特征在于,包括编码端的编码步骤及解码端的解码步骤,其中编码端的编码步骤具体为:101、在编码端,根据编码器的输出码率和处理帧的长度计算出编码帧长,确定语音特征参数,包括线谱对频率LSF、基音周期Pitch、增益G、非周期标志、残差谐波幅度Fsmag、带通清/浊音强度VP量化所用的比特数,设计出编码帧结构;102、输入语音信号,首先对输入的语音信号进行预处理,滤除工频干扰信号,截取M1长度的语音信号为一子帧,两个子帧组成一个超帧,M1表示语音信号的长度;103、设计编码数据缓存器结构,确定分析语音特征参数所用的窗函数的中心位置;104、采用步骤103中确定的窗函数对语音信号进行截断处理后,提取子帧的语音特征参数,以超帧为单位,对语音特征参数进行联合量化,具体为:将超帧的语音特征参数按分配的比特数进行标量量化或矢量量化,包括步骤:A1、提取子帧的基音周期Pitch,经对数化后进行7bit标量量化;A2、判断子帧的清音/浊音(U/V)状态,如果为清音子帧,则不提取清/浊音强度VP值;如果是浊音子帧,则提取清/浊音强度VP值。对浊音子帧进行分带处理,浊音子帧通过带通滤波器后分为5个子带,如果子带为清音状态,用“0”表示,如果子带为浊音状态,用“1”表示。对浊音子帧的后4个子带的带通清/浊音强度VP用2bit量化,即:将0001、0010、0011、0100、0101归入0000,用00编码;将1001,1010,1011归入1000,用01编码;将1101归入1100,用10编码;将1110,0111,0110归入1111,用11编码;A3、提取每子帧的增益G,用8bit进行标量量化;A4、提取超帧中第一个浊音子帧的残差谐波幅度Fsmag值,进行8bit矢量量化。对清音子帧不提取Fsmag值;A5、对提取子帧的线谱对频率LSF分模式进行量化,当两子帧分别为浊音清音或清音浊音时,浊音子帧和清音子帧的LSF分别采用19bit和10bit矢量量化;当两子帧均为清音时,两子帧的LSF都采用10bit进行矢量量化;当两子帧均为浊音时,第一子帧的LSF1采用19bit矢量量化,利用LSF1对第二子帧的LSF2进行预测,得到预测值
计算LSF2的残差信号
然后对残差值ΔLSF2做8bit矢量量化;105、利用编码后超帧结构中的剩余比特将步骤104所得的重要参数进行差错控制编码,组成二进制比特流后,传送给解码端;在解码端,解码端的解码步骤为:106、解码端接收编码端发送来的比特流,并从接收到的比特流中解析出各语音特征参数的量化索引值,通过量化索引得到语音特征参数的初值,然后进行语音特征参数完整性重构;107、根据步骤106解析出的基音周期Pitch值判断该子帧的清/浊状态。若为浊音子帧时,利用残差谐波幅度Fsmag和带通清/浊音强度VP生成周期性脉冲激励信号;如果为清音子帧,激励为白噪声信号。激励信号经过合成滤波器后,得到重构的语音信号;108、对重构的语音信号进行增益调整和脉冲散布滤波,得到最终合成的语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510434127.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种管端定位挡板机动锁定退出机构
- 下一篇:一种工程用模具





