[发明专利]近透明或透明的多声道编码器/解码器方案有效
申请号: | 200580048291.0 | 申请日: | 2005-10-04 |
公开(公告)号: | CN101120615A | 公开(公告)日: | 2008-02-06 |
发明(设计)人: | 约纳斯·林德布罗姆 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | H04S3/00 | 分类号: | H04S3/00;G10L19/00 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 朱进桂 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 透明 多声道 编码器 解码器 方案 | ||
技术领域
本发明涉及多声道编码方案,具体涉及参数多声道编码方案。
背景技术
如今,有两种技术在充分利用立体声音频信号中所包含的立体声冗余和不相干方面占优势。中侧(M/S)立体声编码[1],主要针对冗余去除,并基于以下事实:由于两个声道经常完全相关,因此对这两个声道之和以及差进行编码更加有益。因此,与较低功率侧信号(sidesignal)(或差信号)相比,可以在高功率的和信号上消耗更多比特。另一方面,强度立体声编码[2,3]在每个子带上通过以和信号和方位角代替两个信号来实现不相干去除。在解码器中,将方位角参数用于控制由子带和信号所表示的听觉事件的空间位置。将中侧和强度立体声广泛地用于现有的音频编码标准[4]。
M/S方法关于冗余利用的问题在于,如果两个分量异相(一个相对于另一个延迟),则M/S编码增益为零。这是概念问题,因为在实际的音频信号中时间经延迟频繁发生。例如,空间听力在很大程度上依靠信号(尤其是低频率信号)之间的时间差[5]。在音频记录中,时间延迟源于立体声麦克风装备,以及人工后处理(音响效果)。在中侧编码中,经常将自组织解决方案用于时间延迟问题中:在不同信号的功率小于和信号的功率的常因子时只采用M/S编码[1]。在[6]中更好地提出了对准问题,在其中从另一个信号分量来预测信号分量之一。在编码器中,逐帧得到预测滤波器,并将其作为侧信号方面信息进行传输。在[7]中,考虑了反向自适应备选。要注意的是,性能增益很大程度上取决于信号类型,但是针对特定类型的信号,获得了与M/S立体声编码相比的显著增益。
近来,参数立体声编码受到了很大关注[8-11]。基于核心单声道(单一声道)编码器,这种参数方案提取了立体声(多声道)分量,并以相对低的比特率对其进行独立编码。可以将此看作强度立体声编码的概括。参数立体声编码方法在音频编码的低比特率范围内特别有用,这导致只将全部比特预算中的一小部分用于立体声分量的质量的显著增长。参数方法还由于可以缩放到多声道(多于两个声道)情况并具有提供反向兼容的能力而引人注目:MP3环绕声[12]就是这样的一个示例,其中对多声道数据进行编码,并通过数据流的侧信号声场进行传输。这允许接收机不具有对正常的立体声信号进行编码的多声道性能,但是环绕声使能的接收机可以享有多声道音频。参数方法经常依靠对不同的技术心理声学,主要是声道间电平差(ICLD’s)和声道间时间差(ICTD’s)。在[11]中,提出了相干参数对于固有的音响效果具有重要意义。然而,参数方法受到以下限制:由于固有的模型限制,编码器在较高比特率时不能够达到透明质量。
该问题涉及参数多声道编码器,该参数多声道编码器的最大可获得质量值被限制到明显在透明质量之下的阈值。参数质量阈值如图11中的1100所示。从表示根据BBC增强型单声道编码器(1102)的质量/比特率的示意性曲线图中可以看出,该质量不能超过与比特率无关的参数质量阈值1100。这意味着,即使使用增大的比特率,这种参数多声道编码器的质量也不再增大。
BCC增强型单声道编码器是针对当前存在的立体声编码器或多声道编码器的示例,在其中执行立体声-下混音或多声道下混音。此外,通过描述声道间电平关系、声道间时间关系、声道间相干关系等导出参数。
该参数不同于诸如中侧编码器的侧信号之类的波形信号,因为与参数表示相比,该侧信号描述了以波形格式存在的两个声道之差,这通过给出特定参数而非逐个样本的波形表示描述了两个声道之间的相似性或相异性。在参数需要用于从编码器传输到解码器的少量比特的同时,波形描述,即从波形中导出的残留信号,需要比理论上所允许的透明重构更多的比特。
图11示出了根据这种基于波形的传统的立体声编码器(1104)的典型质量/比特率。从图11中可以明显看出,比特率越大,诸如中侧立体声编码器的传统立体声编码器的质量也越高,直至该质量达到透明质量。存在一种“交叉比特率”,在这个比特率处,参数多声道编码器的特性曲线1102和传统的基于波形的立体声编码器的曲线1104相互交叉。
在这个交叉(cross-over)比特率之下,参数多声道编码器远优于传统的立体声编码器。当针对两个编码器考虑同一比特率时,参数多声道编码器提供了比传统的基于波形的立体声编码器的质量高出质量差1108的质量。换言之,当希望具有特定质量1110时,可以使用参数编码器按照与传统的基于波形的立体声编码器相比减少了差比特率1112的比特率来实现这个质量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580048291.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在移动数据单元处的布置
- 下一篇:抑制智能天线主波束内多用户干扰的方法