[发明专利]用于生成和交互式地渲染基于对象的音频的方法和系统有效
申请号: | 201480020223.2 | 申请日: | 2014-04-03 |
公开(公告)号: | CN105103571B | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 斯里巴拉·S·梅赫塔;托马斯·齐格勒;贾尔斯·贝克;杰弗里·里德米勒;普林亚尔·桑索姆布 | 申请(专利权)人: | 杜比实验室特许公司;杜比国际公司 |
主分类号: | H04S7/00 | 分类号: | H04S7/00;G10L19/008 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 杜诚,陈炜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 交互式 渲染 基于 对象 音频 方法 系统 | ||
相关申请的交叉引用
本申请要求于2013年4月3日提交的美国临时专利申请第61/807,922号的申请日的权益以及于2013年6月7日提交的美国临时专利申请第61/832,397号的申请日的权益。
技术领域
本发明涉及音频信号处理,并且更具体地,涉及包括音频内容(指示扬声器通道和至少一个音频对象通道)以及支持音频内容的交互式渲染(rendering)的元数据的音频数据比特流的编码、解码和交互式渲染。本发明的一些实施方式以被称为Dolby数字(AC-3)、Dolby数字+(增强的AC-3或E-AC-3)或Dolby E的格式中的一种格式生成、解码和/或渲染音频数据。
背景技术
Dolby、Dolby数字、Dolby数字+和Dolby E是杜比实验室特许公司的商标。杜比实验室提供分别被称为Dolby数字和Dolby数字+的AC-3和E-AC-3的专有实现。
虽然本发明不限于用于根据E-AC-3(或AC-3或Dolby E)格式对音频数据进行编码或者用于递送、解码或渲染E-AC-3、AC-3或Dolby E编码数据,但是为了方便起见,将在实施方式中描述本发明,其中其根据E-AC-3或AC-3或Dolby E格式对音频比特流进行编码,并且递送、解码和渲染这样的比特流。
典型的音频数据流包括音频内容(例如,音频内容的一个或更多个通道)以及指示音频内容的至少一个特征的元数据二者。例如,在AC-3比特流中,存在几个音频元数据参数,这几个音频元数据参数具体意在用于改变被递送至收听环境的节目的声音。
AC-3或E-AC-3编码比特流包括元数据,并且可以包括音频内容的1至6个通道。音频内容是已经使用感知音频编码被压缩的音频数据。AC-3编码的细节是众所周知的,并且在包括以下项的很多公开的参考文献中阐述AC-3编码的细节:
ATSC标准A52/A:数字音频压缩标准(AC-3),修订本A,高级电视系统委员会,2001年8月20日;以及
美国专利5,583,962;5,632,005;5,633,981;5,727,119;以及6,021,386。
在例如以下中阐述了Dolby数字+(E-AC-3)编码的细节:“Introduction to Dolby Digital Plus,an Enhancement to the Dolby Digital Coding System(Dolby数字+的介绍,Dolby数字编码系统的增强)”,AES会议论文6196,第117届AES会议,2004年10月28日。
在以下中阐述了Dolby E编码的细节:“Efficient Bit Allocation,Quantization,and Coding in an Audio Distribution System(音频分发系统中的高效的位分配、量化和编码)”,AES预印本5068,第107届AES会议,1999年8月,以及“Professional Audio Coder Optimized for Use with Video(被优化以供视频使用的专业音频编码器)”,AES预印本5033,第107届AES会议,1999年8月。
AC-3编码音频比特流的每帧包括针对数字音频的1536个样本的元数据和音频内容。对于48kHz的采样速率,这表示32毫秒的数字音频,或者音频的每秒31.25帧的速率。
取决于帧是否分别包含1、2、3或6个音频数据块,E-AC-3编码音频比特流的每帧包含针对数字音频的256、512、768或1536个样本的元数据和音频内容。对于48kHz的采样速率,这分别表示5.333、10.667、16或32毫秒的数字音频,或者分别表示音频的每秒189.9、93.75、62.5或31.25帧的速率。
如图1所示,每个AC-3帧被划分成多个部分(分段),包括:包含(如图2所示)同步字(SW)和两个纠错字中的第一纠错字(CRC1)的同步信息(SI)部分;包含大部分元数据的比特流信息(BSI)部分;包含数据压缩音频内容(并且还可以包含元数据)的6个音频块(AB0至AB5);包含在压缩音频内容之后剩余的任何未使用的位的无用位(W);可以包含更多元数据的辅助(AUX)信息部分;以及两个纠错字中的第二纠错字(CRC2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司,未经杜比实验室特许公司;杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480020223.2/2.html,转载请声明来源钻瓜专利网。