[发明专利]一种基于SILK的语音编码器编码效率提高方法在审
申请号: | 201810040152.2 | 申请日: | 2018-01-16 |
公开(公告)号: | CN108231083A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 李强;张玲;明艳;王怡曼 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/012;G10L19/16;G10L19/26;G10L21/0208;G10L25/78;G10L25/93 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于SILK的语音编码器编码效率提高方法。具体实施方法包括:首先,对输入语音信号中添加特定噪声,生成模拟信号,然后对该模拟信号进行长时和短时预测,提高预测滤波器的预测增益,减少量化索引的熵,从而提高编码效率;其次,在编码端通过最小化感知加权重建误差来确定激励信号,在解码端采用后置滤波来压缩量化噪声和信号之间具有较高相关性的频谱区域,通过对噪声整形量化器的输入和重构信号添加不同的加权滤波器,使得以上两个功能在编码端的量化器中得到联合。采用本发明提出的方法,既不需要边带信息,也不用改变比特流格式,又能提高SILK的编码效率。 | ||
搜索关键词: | 编码效率 语音编码器 模拟信号 噪声整形量化器 比特流格式 加权滤波器 预测滤波器 边带信息 后置滤波 激励信号 量化索引 量化噪声 频谱区域 输入语音 重构信号 编码端 解码端 量化器 最小化 预测 长时 加权 感知 噪声 压缩 重建 联合 | ||
【主权项】:
1.一种基于SILK的语音编码器编码效率提高方法,其特征在于,其包括编码端的编码步骤及解码端的解码步骤,其中基于SILK的语音编码器编码效率提高方法,步骤具体为:101、输入语音信号,首先对输入语音信号进行VAD处理,检测出语音中出现的停顿、静默间隔和有效语音成分,同时,将语音信号通过截止频率为70Hz的高通滤波器,消除所有直流偏置和50Hz或60Hz嗡嗡声;102、对语音信号进行基音分析,SILK通过开环基音分析对语音信号进行清/浊音判决,对浊音信号的基音周期进行估计,得到基音的自相关系数和基音时延;103、将高通滤波的输出信号进行噪声整形分析,利用噪声整形分析得到预滤波器和噪声整形量化器中使用的增益和滤波器系数;104、将基音分析和噪声整形分析得到的信号,输入生成模拟信号模块,同时对基音分析输出信号进行LTP分析,对噪声整形分析的输出进行前置滤波处理;105、对经过生成模拟信号模块和高通滤波处理后的语音信号进一步进行预测分析,然后提取出LSF参数,并采用多级矢量量化来提取特征参数,再将量化之后的参数转换为LPC系数,通过这一转换实现编解码的同步;106、在步骤105的基础上进行噪声整形量化,通过噪声整形使得噪声频谱跟随信号的频谱变化,使噪声不易被听见;107、对所提取到的语音特征参数进行区间编码,实现整个编码过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810040152.2/,转载请声明来源钻瓜专利网。