[发明专利]用于编码和解码音频信号的方法和装置有效
申请号: | 201480032227.2 | 申请日: | 2014-05-27 |
公开(公告)号: | CN105264595B | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 彼得·加克斯;亚历山大·库鲁格尔 | 申请(专利权)人: | 杜比国际公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/24 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 张劲松 |
地址: | 荷兰阿*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 环绕 立体声 立体声信号 音频比特流 维度降低 残差 分层 方法和装置 解码 残差信号 多路复用 分层编码 结构信息 输出信号 信号执行 信号渲染 音频信号 比特流 基础层 新概念 重建 | ||
本发明介绍了对HOA内容进行分层编码的新概念。用于编码分层音频比特流的方法包括:将HOA输入信号渲染为环绕立体声,编码环绕立体声以用于基础层输出信号,解码经编码的环绕立体声以获得经重建的环绕立体声信号,对所接收的HOA输入信号执行维度降低,计算经维度降低的HOA信号和经重建的环绕立体声信号之间的残差,编码该残差信号,以及将关于HOA输入信号的结构信息、经编码的残差和经编码的环绕立体声多路复用为比特流以获得分层音频比特流。
技术领域
本发明涉及用于编码音频信号的方法、用于编码音频信号的装置、用于解码音频信号的方法和用于解码音频信号的装置。
背景技术
对高阶高保真度立体声响复制(Higher-Order Ambisonics,HOA)内容的压缩尚未在科学文献中被深入地研究。因此,本节内容将介绍用于HOA内容的自包含压缩的示例性当前技术的整体架构。通过广泛的测试已经验证了此架构使能以中级(例如,256kbit/s)到高级(例如,1.5Mbit/s)数据速率对高分辨率空间声音场景的高质量编码。本节所提供的背景信息对于理解在此架构上建立的分层概念来说是必要的。
图1从编码器的角度示出了自包含HOA压缩的概念。应当注意的是图中所提供的数字和参数是示例性的。例如,这里所示出的编解码器架构用于编码4阶HOA内容(N=4),其需要(N+1)2=25个等效的音频通道来进行全3D表现。相同的概念可被用于从N=1向上的任何HOA阶数的编码。同样地,在维度降低之后所提取的“音频通道”的数字8是应当突出数量级的示例性数字——然而,当编码阶数为N=4的HOA内容时,已经发现此数字8(平均来说)是适当的。
编码过程被分为两个级,这两个级在一定程度上彼此独立。第一级10是维度降低级。维度降低级10分析输入HOA内容,并且通过将信号重组为更低数量的主导声音组分来降低信号维度。有点抽象的术语“声音组分”之所以被使用是因为所产生的信号不一定对应于声音对象、特定的空间方向或环绕感(ambience)——尽管在特殊情况下它们实际上也可以这样对应。
从信息论可知,至少对于复杂音频场景来说,在此级10的输出处所提供的信息系统地少于输入信息。维度降低级10以这样的方式操作:(1)通过尽可能多地利用输入音频场景的固有冗余使信息丢失被最小化,以及(2)不相干度被降低,即输出信号仍携带足够的信息从而经重建的音频场景与输入内容相比的感知差异被最小化。此级10采用时变和信号自适应的信号处理。取决于参数化和信号特征,其输出信号的数量也可以是自适应的。
第二编码级11包括针对单声道音频信号的若干并行感知编码器(在此例中为8个)组成的组。这些编码器使用时频编码的原理来操作和编码独立的主导声音组分,时频编码原理自1990年代已经被很好地建立起来。例如,MPEG-4高级音频编码(AAC)编码器组可在第二编码级11被使用。编码器实施方式需要被稍加修改以使全局代码器控制块能够影响这些核心编解码器的某些参数,诸如,平均比特率、窗口切换行为、比特池大小、频带复制行为等等。这种架构已经被选择,因为其通过在可能的最大程度上促进对现有编解码器实施方式和相应的优化方式的重复使用来将实施HOA编解码器所需的设计工作减少到最低限度。
整个解码器的操作由代码器控制级12控制。这里执行了确定驱动和控制其他信号处理级所需的参数的感知音频场景分析。具体来说,这种控制实例负责数据速率资源的全局优化,并且对于实现强大的总体率失真性能是非常重要的。最后,第二编码级11的结果比特流和来自代码器控制级12的边信息(side information)被多路复用13至单个输出比特流中。
发明内容
所期望的是通过允许与其他/环绕立体声格式的至少基本的兼容性的方式来编码HOA。图1所示的架构的一个问题在于其仅适用于HOA格式的信号。本发明介绍了用于对HOA内容进行分层编码的新的概念、方法和装置,其产生了可向后兼容的环绕立体声格式的比特流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比国际公司,未经杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480032227.2/2.html,转载请声明来源钻瓜专利网。