[发明专利]利用基音延迟曲线调整对信息信号编码的方法和装置有效
申请号: | 200680027207.1 | 申请日: | 2006-06-29 |
公开(公告)号: | CN101228573A | 公开(公告)日: | 2008-07-23 |
发明(设计)人: | 詹姆斯·P·阿什利;乌达·米塔尔 | 申请(专利权)人: | 摩托罗拉公司 |
主分类号: | G10L11/04 | 分类号: | G10L11/04 |
代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 陆锦华;黄启行 |
地址: | 美国伊*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 基音 延迟 曲线 调整 信息 信号 编码 方法 装置 | ||
技术领域
本发明一般涉及通信系统,尤其是涉及这种通信系统中对信息信号进行编码。
背景技术
数字语音压缩系统通常需要估计输入信号的基频。基频f0通常是根据基音延迟τ0(或被称为“迟滞”)来估计。两者关系由下式表达:
其中,采样频率fs对于电话级别应用而言通常为8000Hz。
由于语音信号通常为不稳定的,因此被其划分为被称为帧的有限长度矢量,每帧被假定为亚稳态。这些帧的长度通常为10到40毫秒的量级。然后,按照相关的帧长度间隔,对描述该语音信号的参数进行更新。原始的码激励线性预测(CELP)算法按照更短的子帧间隔,进一步更新基音周期信息(利用被称为长期预测的方法,或称为LTP),因此能够实现帧到帧的更平滑过渡。还曾注意到,尽管可以使用开环方法估计τ0,但是使用闭环方法可以得到好得多的性能。闭环方法涉及以子帧为基础,对τ0的不同可能值(通常为从20到147的整数值)进行反复试验搜索,并选择满足一些最低误差标准的值。
这种方法的改进方法包括允许τ0取整数加小数值,如美国专利No.US5359696中给出的那样。这种方法的实际应用的例子能够在GSM半速率语音编码器中找到,如附图1所示,并在美国专利No.US5253269中有说明。这里,21到22-2/3范围内的迟滞是允许的1/3采样分辨率,23到34-5/6范围内的迟滞是允许的1/6采样分辨率,等等。为了保持低的搜索复杂度,使用开环方法和闭环方法的组合。开环方法涉及使用自相关峰值拾取算法生成整数迟滞候选值列表。随后,闭环方法在该整数迟滞候选值附近的可允许迟滞中搜索最佳小数迟滞值。而且,根据与前一子帧之间的差值,对子帧2、3和4的迟滞进行编码。由于存在迟滞参数的高帧内相关,所以这使得能够使用更少的比特对该迟滞信息进行编码。即使如此,GSM HR编解码器仍然每20毫秒使用总共8+(3×4)=20比特来传送该基音周期信息(1.0kbps)。
在降低基音周期信息的位速率的努力中,已开发了一种插值策略,其允许每帧仅对基音信息编码一次(仅仅使用7比特=>350bps),而不是使用通常的子帧解决方案。这项技术被称为松弛码激励线性预测(或者RCELP)技术,并且成为用于码分多址(CDMA)无线电话系统的增强变速率编解码器(EVRC)标准的基础。其基本原理如下。
为以当前帧的终点为中心的分析窗口,估计基音周期。接着生成迟滞(基音延迟)曲线,其由过去帧迟滞到当前帧迟滞的线性插值构成。接着,借助于复杂多相滤波和偏移技术来修正该去线性预测(LP)残差信号,被设计用于将残差波形与所估计的基音延迟曲线相匹配。此残差修正过程的主要原因是解决开环整数迟滞估计过程的精度限制。例如,如果该整数迟滞被估计为32个样本,当实际上真实的迟滞为32.5个样本时,在单个160采样帧中,该残差波形可以与所估计的延迟冲突2.5个样本之多。这会严重降低LTP的性能。该RCELP算法通过在残差波形中的感知上不重要的情形期间(例如,低能量)对残差波形进行移位以与所估计的基音延迟曲线匹配,来解决这个问题。通过修正残差波形以与所估计的基音延迟曲线匹配,保留了LTP的效率,并维持了编码增益。另外,要求可以忽略由于残差修改引起的相关的感知衰退。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于摩托罗拉公司,未经摩托罗拉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680027207.1/2.html,转载请声明来源钻瓜专利网。