[发明专利]一种用于感知音频编码的量化器自适应调整方法有效

专利信息
申请号: 200710074551.2 申请日: 2007-05-23
公开(公告)号: CN101312042A 公开(公告)日: 2008-11-26
发明(设计)人: 吴晟;邱小军;黎家力;陈强 申请(专利权)人: 中兴通讯股份有限公司
主分类号: G10L19/02 分类号: G10L19/02
代理公司: 深圳创友专利商标代理有限公司 代理人: 罗瑶
地址: 518057广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 感知 音频 编码 量化 自适应 调整 方法
【说明书】:

技术领域

发明涉及感知音频编码中的量化器,具体地说涉及一种用于感知音频编码的量化器自适应调整方法。

背景技术

编码器的量化失真和量化器的区间划分和量化值大小有关。标量量化器将落在量化区间[x(i),x(i+1))的信号x映射为量化电平y(i);x(i)是量化边界点,量化电平的间隔称为量化阶距。量化阶距相等且量化区间相等的量化器为均匀量化器,否则为非均匀量化器。利用质心条件和最佳划分条件,可以用迭代的方式求得最佳量化电平和量化区间,它能获得最小的量化均方误差。

感知音频编码器中,MPEG-1Layer1和Layer2中使用均匀标量量化器。均匀量化器结构简单,但是其量化信噪比会随着量化电平数的减小而下降,在小信号时信噪比较差,因此,均匀量化器只有在信号均匀分布时才是最优量化器,非均匀分布信号的最优量化器是非均匀量化器。非线性扩压是非均匀量化中最常用的技术。MPEG-1Layer3和MPEG-4AAC都使用了非线性扩压和可变量化阶距来实现非均匀量化,其非均匀量化器遵循了音频中小信号多的特性,减少了量化均方误差。

感知音频编码器的原始量化谱由下式获得

x=|x|λΔ-1        (1)

其中x是变换域谱,λ是扩压系数,Δ是动态量化步长,它对特定子带是不变的,由于后文的论述都是在子带中进行的,故可将Δ视为常数。在MPEG-4AAC中,x是MDCT(改进的离散余弦变换)谱,λ=3/4。原始量化谱规范到量化电平i=0,1,2,…得到整数量化谱

xq=level[x]       (2)

其中,level表示电平规范操作。有损音频编码中,电平规范操作是减少信息量的主要手段和编码噪声的主要来源。MPEG-4AAC标准推荐采用量化边界点x(i)=i-0.4054,用一个特殊的取整完成电平规范操作:

xq=int[x+i-x(i)]  (3)

int表示提取实数的整数部分。对于原始量化谱x而言,这相当于量化电平为[0,1,2,3,......],电平区间为[0,1],[1,2],[2,3],……,量化区间为[0,0.5946),[0.5946,1.5946),[1.5946,2.5946),......的等间距量化器。AAC的反量化公式为

xiq=sign(x)(xqΔ)1/λ                     (4)

量化均方误差为

DMSE=(x-xiq)2={χ1/λ-level[χ]1/λ}2Δ2/λ   (5)

MPEG-4AAC编码以帧为单位,在子带中进行,需要考虑子带信号的整体失真。不失一般性,认为子带原始量化谱是N+1维向量,其中最大值为χmax

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710074551.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top