[发明专利]多通道音频数据编码/解码方法和设备有效

专利信息
申请号: 201010122240.0 申请日: 2005-07-14
公开(公告)号: CN101789792A 公开(公告)日: 2010-07-28
发明(设计)人: 吴殷美;金美英;金尚煜;金度亨;金重会 申请(专利权)人: 三星电子株式会社
主分类号: H03M7/30 分类号: H03M7/30;G10L19/00
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 刘奕晴;韩明星
地址: 韩国京畿*** 国省代码: 韩国;KR
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 通道 音频 数据 编码 解码 方法 设备
【说明书】:

本申请是申请日为2005年7月14日、申请号为200510084143.6、题为 “多通道音频数据编码/解码方法和设备”的专利申请的分案申请。

技术领域

本发明涉及音频编码和解码,更具体地讲,涉及多通道音频数据编码和 解码方法以及设备。

背景技术

从2003年起,地面数字多媒体广播(DMB)已经使用音频编解码器 MPEG-4比特分片算术编码(BSAC)。尽管目前只能提供立体声服务,但是 可以预期在将来将包括多通道服务。MPEG-4BASC应该能够增加压缩效率 和改善技术的功能,例如带宽扩展的和空间音频。

在传统BSAC多通道中,在一个层中交替地编码中央、前左、前右、后 左和后右通道。图1示出传统BASC多通道的结构。BSAC结构提供精细可 分级(FGS)功能。即,所有五个通道在一个层中并且可从最后层中剪切数 据。关于通道的工具旁信息(side information)应该在general_header(通用 头)中限定。考虑到每个通道中的特性,高性能压缩需要单独的旁信息。

图2是使用传统的BSAC方法的音频编码设备的功能模块的框图。该设 备包括心理声学模型单元200、时间/频率映射单元210、时域噪声修整(TNS) 单元220、强度立体声处理单元230、知觉噪声替换(PNS)单元240、中侧 (M/S)立体声处理单元250、量化单元260和比特打包单元270。

由于相对于时间人可以觉察的信号之间的差别不是很大,所以时间/频率 映射单元210将时域中的音频信号转换为频域中的信号。然而,在频域中的 信号的情况下,相对于人类声学模型,可被人觉察的信号与不能被人觉察的 信号之间的差别在每个带宽中都很大。因此,通过改变相对于每个频率带宽 的比特数,可增强压缩的效率。

心理声学模型单元200将被时间/频率映射单元从时域转换到频域中的音 频信号结合到合适的子带的信号中,并通过使用由每个信号的交互作用而发 生的掩蔽现象,计算每个子带的掩蔽阈值。TNS单元220被用于控制每个转 换窗口中的量化噪声的时域形状。通过应用频率数据的滤波处理实现TNS。 TNS单元220被随意地应用在编码器中。强度立体声处理单元230被设计为 用于更有效地处理立体声信号。在该装置中,仅关于相对于两个通道之一的 比例因子波段的量化信息被编码,并且相对于剩余的通道仅仅比例因子被发 送。在编码器中,不是必须使用单元230。在当前帧中信号具有强噪声特性 的情况下,通过编码与比例因子波段相应的频率分量的每个的能量值,而不 编码频率系数的值,PNS单元240可以减少产生的将被使用的比特的量。PNS 单元240可确定是否以比例因子波段为单位使用比特。M/S立体声处理单元 230也是用于更有效地处理立体声信号的装置。在该装置中,左通道的信号 和右通道的信号分别被转为被加的信号和被减的信号,然后这些信号被处理。 在编码器中,也不是必须使用M/S立体声处理单元。量化单元260执行每个 波段的频率信号的标量量化,从而使得每个波段的量化噪声的大小小于掩蔽 阈值,这样人们就感觉不到噪声。比特打包单元270收集在编码设备的每个 模式中产生的信息项,并根据产生的适合于可分级的(scalable)音频编解码 器的句法形成比特流。

然而,在图1中所示的传统的BSAC多通道结构中,不能使用中侧(M/S) 立体声。这是因为在传统的编码和解码句法中,当通道的数目是2或更多时, 不能使用M/S立体声功能。因此,编码效率降低。另外,由于窗口切换和PNS 对于所有的通道应该使用相同的旁信息,因此,编码效率降低。此外,由于 5通道全部被交织,需要比单声道音频的内存大5倍的内存。

发明内容

本发明提供一种多通道音频数据编码方法以及设备,该方法和设备遵守 MPEG标准并改善传统的多通道BSAC方法的性能。

本发明还提供一种多通道音频数据解码方法以及设备,该方法和设备遵 守MPEG标准并改善传统的多通道BSAC方法的性能。

根据本发明的一方面,提供了一种多通道音频信号编码方法,包括:编 码单声道和/或立体声音频数据;编码除了单声道和/或立体声音频数据之外的 扩展的多通道音频数据。单声道和/或立体声音频数据可具有分层的比特率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010122240.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top