[发明专利]使用自适应混合变换的多声道音频编码比特流的解码有效

申请号：	201410410643.3	申请日：	2010-10-28
公开（公告）号：	CN104217724A	公开（公告）日：	2014-12-17
发明（设计）人：	K·拉马莫尔西	申请（专利权）人：	杜比实验室特许公司
主分类号：	G10L19/008	分类号：	G10L19/008;G10L19/02
代理公司：	中国国际贸易促进委员会专利商标事务所 11038	代理人：	欧阳帆
地址：	美国加***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	使用自适应混合变换多声道音频编码比特流解码
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本分案申请是基于申请号为201080051553.X(国际申请号为PCT/US2010/054480)，申请日为2010年10月28日，发明名称为“使用自适应混合变换的多声道音频编码比特流的解码”的中国专利申请的分案申请。

相关申请的交叉引用

本申请案请求2009年12月7日提交的第61/267,422号美国临时专利申请案的优先权，所述申请案的全部内容以引用的方式并入本文。

技术领域

本发明通常涉及音频编码系统，且更具体来说涉及对已编码的数字音频信号进行解码的方法和装置。

背景技术

由团体合作联合委员会(JCIC)的成员组织成立的美国先进电视系统委员会(ATSC)公司开发出用于美国本地电视服务发展的一套协调一致的国家标准。包括有关音频编码/解码标准的这些标准在多个文件中进行陈述，所述多个文件包括2005年6月14日出版的名称为“Digital Audio Compression Standard(AC-3,E-AC-3)”的文件A/52B(修订版B)，其全部内容以引用的方式并入本文。文件A/52B中指定的音频编码算法称为“AC-3”。描述在所述文件的附件E中的此算法的一加强版称为“E-AC-3”。这两个算法在本文中称为“AC-3”，且有关标准在本文中称为“ATSC标准”。

所述A/52B文件并未指定算法设计的很多方面，而是描述了“比特流语法”，其定义了兼容解码器一定能够解码的编码信息的结构与语法特征。符合所述ATSC标准的很多应用将编码数字音频信息作为二进制数据以串行方式发送。结果，所述编码数据通常指的是比特流，但其它数据安排也是允许的。为了便于论述，术语“比特流”在本文中用来指编码数字音频信号，而与采用何种格式、记录或传输技术无关。

符合所述ATSC标准的比特流以一连串“同步帧”的形式排列。每一帧是比特流的一个单元，其能够被完全解码成脉冲编码调制(PCM)的数字音频数据的一个或更多个声道。每一帧包括“音频块”和与所述音频块相关的帧元数据。所述音频块各包含表示一个或更多个音频声道的数字音频样本的编码音频数据和与所述编码音频数据相关的块元数据。

尽管算法设计的细节在所述ATSC标准中未被指定，但是某些算法特征已被专业解码装置与消费解码装置的制造商广泛采用。可以解码由E-AC-3编码器产生的增强型AC-3比特流的解码器的实施方式的一个普遍特征在于如下的算法，所述算法在解码另一声道的数据之前解码一帧中针对相应声道的所有编码数据。此方法已经用来提高具有很小芯片上存储器的单芯片处理器的实施性能，这是因为一些解码过程需要从一帧中的多个音频块中的每一块得到指定声道的数据。通过以声道顺序处理编码数据，解码操作可以利用针对特定声道的芯片上存储器来执行。解码后的声道数据可以随后转移到芯片外存储器来为下一个声道空出芯片上资源。

符合所述ATSC标准的比特流可以非常复杂，因为可能有大量变化。本文只简略提及的一些示例包括对于标准AC-3比特流、多个独立流、依赖的子流的声道耦合、声道重新矩阵化、对白归一化(dialog normalization)、动态范围压缩、声道向下混合与块长度转换以及对于增强型AC-3比特流的频谱扩展和自适应混合变换。这些特征的细节可以从所述A/52B文件获得。

通过独立处理每一声道，这些变化所需的算法能够得以简化。可以不考虑这些变化来执行如合成过滤之类的随后的复杂处理。较简单的算法似乎提供了如下优势：减少处理一个音频数据帧所需的计算资源。

遗憾的是，此方法要求解码算法读取和检查所有音频块中的数据两次。读取和检查一帧中的音频块数据的每次重复在本文中称为一次“通过(pass)”所述音频块。第一次通过执行大量计算以确定每一块中的编码音频数据的位置。当第二次通过执行解码过程时，其执行很多与所述第一次通过执行的这些计算相同的计算。两次通过都需要相当多的计算资源来计算数据位置。如果最初的通过可以被消除，那么可以减少解码一个音频数据帧所需的总处理资源。

发明内容

本发明的一个目的在于减少解码以诸如上面所提及的帧与音频块的分层单元排列的编码比特流中的一个音频数据帧所需的计算资源。以上文字和以下公开指的是符合所述ATSC标准的编码比特流，但是本发明并不局限于仅在这些比特流的情况下使用。本发明的原理基本上可以应用于具有类似于在AC-3编码算法中使用的帧、块和声道的结构特征的任何编码比特流。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司，未经杜比实验室特许公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410410643.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]使用自适应混合变换的多声道音频编码比特流的解码有效

专利文献下载