[发明专利]用于基于对象的音频的交互式渲染的方法和系统有效
申请号: | 201480019107.9 | 申请日: | 2014-03-19 |
公开(公告)号: | CN105103570B | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | R·A·弗朗斯;T·齐埃格勒;S·S·梅塔;A·J·道尔;P·桑索姆布恩;M·D·德怀尔;F·法拉哈尼;N·R·茨恩高斯;F·桑切斯 | 申请(专利权)人: | 杜比实验室特许公司;杜比国际公司 |
主分类号: | H04S7/00 | 分类号: | H04S7/00;G10L19/008 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 欧阳帆 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 基于 对象 音频 交互式 渲染 方法 系统 | ||
对相关申请的交叉引用
本申请要求2013年4月3日提交的美国临时专利申请No.61/807922和2013年6月7日提交的美国临时专利申请No.61/832397的申请日权益,这两个申请通过引用并入于此。
技术领域
本发明涉及音频信号处理,并且更特别地,涉及包括音频内容(通常指示扬声器声道和至少一个可选的音频对象声道)和支持对音频内容的交互式渲染(interactive rendering)的元数据的音频数据比特流的编码、解码和交互式渲染。本发明的一些实施例以被称为杜比数字(Dolby Digital,AC-3)、杜比数字加(Dolby Digital Plus,增强版AC-3或E-AC-3)或者杜比E(Dolby E)的格式之一来生成、解码和/或渲染音频数据。
背景技术
杜比、杜比数字、杜比数字加以及杜比E是杜比实验室授权许可公司(Dolby Laboratories Licensing Corporation)的商标。杜比实验室提供分别被称为杜比数字和杜比数字加的AC-3和E-AC-3的专有实现。
典型的音频数据流包括音频内容(例如,音频内容的一个或更多个声道)和指示音频内容的至少一个特性的元数据。例如,在AC-3比特流中,存在若干个专用于改变被传送给收听环境的节目的声音的音频元数据参数。其中一个元数据参数是DIALNORM参数,该参数意欲指示在音频节目中发生的对话的平均水平,并且被用来确定音频回放信号水平。
虽然本发明不限于与AC-3比特流、E-AC-3比特流或者杜比E比特流一起使用,但是为了方便,在实施例中将描述本发明生成、解码或以其它方式处理这种包括响度处理状态元数据的比特流。
AC-3编码比特流包括元数据和1至6个声道的音频内容。音频内容是已经利用感知音频编码压缩的音频数据。元数据包括若干个打算用于改变被传送到收听环境的节目的声音的音频元数据参数。
AC-3(也称为杜比数字)编码的细节是众所周知的,并且在许多公开文献中得到阐述,包括在ATSC标准A52/A中:Digital Audio Compression Standard(AC-3),修订版A,先进电视系统委员会,2001年8月20日。
杜比数字加(E-AC-3)编码的细节在下文中得到阐述:“Introduction to Dolby Digital Plus,an Enhancement to the Dolby Digital Coding System”,AES会议论文6196,第117届AES会议,2004年10月28日。
杜比E编码的细节在下文中得到阐述:“Efficient Bit Allocation,Quantization,and Coding in an Audio Distribution System”,AES预印本5068,第107次AES会议,1999年8月;和“Professional Audio Coder Optimized for Use with Video”,AES预印本5033,第107次AES会议,1999年8月。
AC-3编码音频比特流的每帧包含针对数字音频的1536个样本的音频内容和元数据。对于48kHz的采样速率,这代表32毫秒的数字音频或者音频的31.25帧/秒的速率。
取决于帧分别包含1、2、3或6个音频数据块,E-AC-3编码音频比特流的每帧包含针对数字音频的256、512、768或1536个样本的音频内容和元数据。对于48kHz的采样速率,这分别代表5.333、10.667、16或32毫秒的数字音频或者音频的189.9、93.75、62.5或31.25帧/秒的速率。
如在图1中所示,每个AC-3帧被分成部分(片段),包括:同步信息(SI)部分,该部分包含(如图2中所示)同步字(SW)和两个纠错字中的第一个(CRC1);比特流信息(BSI)部分,该部分包含大部分元数据;6个音频块(AB0至AB5),其包含经数据压缩的音频内容(并且也可以包括元数据);浪费比特(W),其包含在压缩音频内容之后剩余的任何未使用的比特;辅助(AUX)信息部分,该部分可以包含更多元数据;以及两个纠错字中的第二个(CRC2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司,未经杜比实验室特许公司;杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480019107.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图案标记
- 下一篇:服务器设备、客户端设备、内容分发方法以及计算机程序