[发明专利]一种用于感知音频编码的量化器自适应调整方法有效
申请号: | 200710074551.2 | 申请日: | 2007-05-23 |
公开(公告)号: | CN101312042A | 公开(公告)日: | 2008-11-26 |
发明(设计)人: | 吴晟;邱小军;黎家力;陈强 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 深圳创友专利商标代理有限公司 | 代理人: | 罗瑶 |
地址: | 518057广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 感知 音频 编码 量化 自适应 调整 方法 | ||
技术领域
本发明涉及感知音频编码中的量化器,具体地说涉及一种用于感知音频编码的量化器自适应调整方法。
背景技术
编码器的量化失真和量化器的区间划分和量化值大小有关。标量量化器将落在量化区间[x(i),x(i+1))的信号x映射为量化电平y(i);x(i)是量化边界点,量化电平的间隔称为量化阶距。量化阶距相等且量化区间相等的量化器为均匀量化器,否则为非均匀量化器。利用质心条件和最佳划分条件,可以用迭代的方式求得最佳量化电平和量化区间,它能获得最小的量化均方误差。
感知音频编码器中,MPEG-1Layer1和Layer2中使用均匀标量量化器。均匀量化器结构简单,但是其量化信噪比会随着量化电平数的减小而下降,在小信号时信噪比较差,因此,均匀量化器只有在信号均匀分布时才是最优量化器,非均匀分布信号的最优量化器是非均匀量化器。非线性扩压是非均匀量化中最常用的技术。MPEG-1Layer3和MPEG-4AAC都使用了非线性扩压和可变量化阶距来实现非均匀量化,其非均匀量化器遵循了音频中小信号多的特性,减少了量化均方误差。
感知音频编码器的原始量化谱由下式获得
x=|x|λΔ-1 (1)
其中x是变换域谱,λ是扩压系数,Δ是动态量化步长,它对特定子带是不变的,由于后文的论述都是在子带中进行的,故可将Δ视为常数。在MPEG-4AAC中,x是MDCT(改进的离散余弦变换)谱,λ=3/4。原始量化谱规范到量化电平i=0,1,2,…得到整数量化谱
xq=level[x] (2)
其中,level表示电平规范操作。有损音频编码中,电平规范操作是减少信息量的主要手段和编码噪声的主要来源。MPEG-4AAC标准推荐采用量化边界点x(i)=i-0.4054,用一个特殊的取整完成电平规范操作:
xq=int[x+i-x(i)] (3)
int表示提取实数的整数部分。对于原始量化谱x而言,这相当于量化电平为[0,1,2,3,......],电平区间为[0,1],[1,2],[2,3],……,量化区间为[0,0.5946),[0.5946,1.5946),[1.5946,2.5946),......的等间距量化器。AAC的反量化公式为
xiq=sign(x)(xqΔ)1/λ (4)
量化均方误差为
DMSE=(x-xiq)2={χ1/λ-level[χ]1/λ}2Δ2/λ (5)
MPEG-4AAC编码以帧为单位,在子带中进行,需要考虑子带信号的整体失真。不失一般性,认为子带原始量化谱是N+1维向量,其中最大值为χmax
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710074551.2/2.html,转载请声明来源钻瓜专利网。