[发明专利]空间音频渲染和编码有效
申请号: | 201380005998.8 | 申请日: | 2013-01-17 |
公开(公告)号: | CN104054126B | 公开(公告)日: | 2017-03-29 |
发明(设计)人: | J.G.H.科彭斯;E.G.P.舒伊杰斯;A.W.J.奧门;L.M.范德科霍夫 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 李舒,汪扬 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空间 音频 渲染 编码 | ||
技术领域
本发明涉及空间音频渲染和/或编码,并且具体地但不排他地,涉及具有不同的空间扬声器配置的空间音频渲染系统。
背景技术
各种源信号的数字编码在过去数十年里已变得日益重要,因为数字信号表示和通信已日益代替模拟表示和通信。例如,诸如语音和音乐这样的音频内容是越来越多地基于数字内容编码的。
音频编码格式已被开发来提供越来越有能力的、变化的且灵活的音频服务,并且特别地,支持空间音频服务的音频编码格式已被开发。
像DTS和杜比数码(Dolby Digital)这样的众所周知的音频编码技术产生编码的多声道音频信号,所述编码的多声道音频信号将空间像表示为在固定位置处的收听者周围被放置的大量声道。对于与对应于多声道信号的设置不同的扬声器设置,空间像将是次优的。并且,这些基于声道的音频编码系统典型地不能够应付不同数目的扬声器。
MPEG环绕提供多声道音频编码工具,所述多声道音频编码工具允许现有的基于单音或立体声的编码器被扩展到多声道音频应用。图1图示了MPEG环绕系统的元件的例子。使用通过对原始多声道输入的分析所获得的空间参数,MPEG环绕解码器能够通过单音信号或立体声信号的受控上混(upmix)来重建空间像以便获得多声道输出信号。
因为多声道输入信号的空间像被参数化,所以MPEG环绕允许通过不使用多声道扬声器设置的渲染装置来解码相同的多声道比特流。例子是在头戴式耳机上的虚拟环绕重放,这被称为MPEG环绕双声道解码过程。在这种模式下,逼真的环绕体验能够在使用普通头戴式耳机时被提供。另一例子是高阶多声道输出(例如7.1声道)到低阶设置(例如5.1声道)的修剪。
为了提供音频的更加灵活的表示,MPEG标准化了称为“空间音频对象编码”(MPEG-D SAOC)的格式。和诸如DTS、杜比数码以及MPEG环绕这样的多声道音频编码系统对比,SAOC提供对单独的音频对象而不是音频声道的高效编码。然而在MPEG环绕中,每个扬声器声道可以被认为源自声音对象的不同混合,SAOC使得单独的声音对象在解码器侧可得到以用于如图2中所图示的交互式操纵。在SAOC中,多个声音对象连同允许声音对象在渲染侧被提取的参数数据一起被编码成单音或立体声缩混(downmix),从而允许单独的音频对象可用于例如由终端用户操纵。
实际上,类似于MPEG环绕,SAOC同样创建单音或立体声缩混。此外,对象参数被计算并且被包括。在解码器侧,用户可以操纵这些参数以便控制单独对象的各种特征,诸如位置、水平、均衡,或者甚至以便应用诸如混响这样的效果。图3图示了使得用户能够控制被包含在SAOC比特流中的单独对象的交互式接口。借助于渲染矩阵,单独的声音对象被映射到扬声器声道上。
实际上,在用于渲染空间声音的渲染配置方面的变化和灵活性在近年来已随着越来越多的再现格式变得可供主流消费者使用而显著地增加。这需要音频的灵活表示。随着MPEG环绕编解码器的引入已采取了重要的步骤。然而,音频仍然针对特定扩音器设置被产生和发送。在不同的设置之上和在非标准(即,灵活的或用户定义的)扬声器设置之上的再现未被指定。
这种问题能够部分地由SAOC解决,所述SAOC发送音频对象而非再现声道。这允许解码器侧将音频对象放置在空间中的任意位置处,只要该空间被扬声器充分地覆盖。这样,在被发送音频与再现设置之间不存在关系,因此任意扬声器设置能够被使用。这对于例如其中扬声器几乎从不在预定位置处的、典型起居室中的家庭影院设置来说是有利的。在SAOC中,在解码器侧判定对象在声音场景中被放置在的地方,其从艺术观点看常常不是期望的。SAOC标准确实提供了用来在比特流中发送默认渲染矩阵从而消除解码器职责的方式。然而,所提供的方法要么依赖固定的再现设置要么依靠未指定的语法。因此,SAOC没有提供独立于扬声器设置来发送音频场景的规范手段。更重要的是,SAOC没有准备好对于扩散信号分量的如实渲染。尽管存在包括所谓的多声道背景对象以便捕获扩散声的可能性,但是这个对象束缚于一个特定的扬声器配置。
针对3D音频的音频格式的另一规范正由3D音频联盟(3DAA)开发,所述3D音频联盟(3DAA)是由SRS(声音检索系统)实验室所发起的行业联盟。3DAA致力于开发用于3D音频的传输的标准,这“将促进从当前扬声器馈送范式到灵活的基于对象的方法的转变”。在3DAA中,允许旧有多声道缩混连同单独的声音对象一起发送的比特流格式将被定义。此外,对象定位数据被包括。生成3DAA音频流的原理在图4中被图示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380005998.8/2.html,转载请声明来源钻瓜专利网。