[发明专利]多通道音频数据编码/解码方法和设备有效
申请号: | 201010122240.0 | 申请日: | 2005-07-14 |
公开(公告)号: | CN101789792A | 公开(公告)日: | 2010-07-28 |
发明(设计)人: | 吴殷美;金美英;金尚煜;金度亨;金重会 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;G10L19/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 刘奕晴;韩明星 |
地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通道 音频 数据 编码 解码 方法 设备 | ||
本申请是申请日为2005年7月14日、申请号为200510084143.6、题为 “多通道音频数据编码/解码方法和设备”的专利申请的分案申请。
技术领域
本发明涉及音频编码和解码,更具体地讲,涉及多通道音频数据编码和 解码方法以及设备。
背景技术
从2003年起,地面数字多媒体广播(DMB)已经使用音频编解码器 MPEG-4比特分片算术编码(BSAC)。尽管目前只能提供立体声服务,但是 可以预期在将来将包括多通道服务。MPEG-4BASC应该能够增加压缩效率 和改善技术的功能,例如带宽扩展的和空间音频。
在传统BSAC多通道中,在一个层中交替地编码中央、前左、前右、后 左和后右通道。图1示出传统BASC多通道的结构。BSAC结构提供精细可 分级(FGS)功能。即,所有五个通道在一个层中并且可从最后层中剪切数 据。关于通道的工具旁信息(side information)应该在general_header(通用 头)中限定。考虑到每个通道中的特性,高性能压缩需要单独的旁信息。
图2是使用传统的BSAC方法的音频编码设备的功能模块的框图。该设 备包括心理声学模型单元200、时间/频率映射单元210、时域噪声修整(TNS) 单元220、强度立体声处理单元230、知觉噪声替换(PNS)单元240、中侧 (M/S)立体声处理单元250、量化单元260和比特打包单元270。
由于相对于时间人可以觉察的信号之间的差别不是很大,所以时间/频率 映射单元210将时域中的音频信号转换为频域中的信号。然而,在频域中的 信号的情况下,相对于人类声学模型,可被人觉察的信号与不能被人觉察的 信号之间的差别在每个带宽中都很大。因此,通过改变相对于每个频率带宽 的比特数,可增强压缩的效率。
心理声学模型单元200将被时间/频率映射单元从时域转换到频域中的音 频信号结合到合适的子带的信号中,并通过使用由每个信号的交互作用而发 生的掩蔽现象,计算每个子带的掩蔽阈值。TNS单元220被用于控制每个转 换窗口中的量化噪声的时域形状。通过应用频率数据的滤波处理实现TNS。 TNS单元220被随意地应用在编码器中。强度立体声处理单元230被设计为 用于更有效地处理立体声信号。在该装置中,仅关于相对于两个通道之一的 比例因子波段的量化信息被编码,并且相对于剩余的通道仅仅比例因子被发 送。在编码器中,不是必须使用单元230。在当前帧中信号具有强噪声特性 的情况下,通过编码与比例因子波段相应的频率分量的每个的能量值,而不 编码频率系数的值,PNS单元240可以减少产生的将被使用的比特的量。PNS 单元240可确定是否以比例因子波段为单位使用比特。M/S立体声处理单元 230也是用于更有效地处理立体声信号的装置。在该装置中,左通道的信号 和右通道的信号分别被转为被加的信号和被减的信号,然后这些信号被处理。 在编码器中,也不是必须使用M/S立体声处理单元。量化单元260执行每个 波段的频率信号的标量量化,从而使得每个波段的量化噪声的大小小于掩蔽 阈值,这样人们就感觉不到噪声。比特打包单元270收集在编码设备的每个 模式中产生的信息项,并根据产生的适合于可分级的(scalable)音频编解码 器的句法形成比特流。
然而,在图1中所示的传统的BSAC多通道结构中,不能使用中侧(M/S) 立体声。这是因为在传统的编码和解码句法中,当通道的数目是2或更多时, 不能使用M/S立体声功能。因此,编码效率降低。另外,由于窗口切换和PNS 对于所有的通道应该使用相同的旁信息,因此,编码效率降低。此外,由于 5通道全部被交织,需要比单声道音频的内存大5倍的内存。
发明内容
本发明提供一种多通道音频数据编码方法以及设备,该方法和设备遵守 MPEG标准并改善传统的多通道BSAC方法的性能。
本发明还提供一种多通道音频数据解码方法以及设备,该方法和设备遵 守MPEG标准并改善传统的多通道BSAC方法的性能。
根据本发明的一方面,提供了一种多通道音频信号编码方法,包括:编 码单声道和/或立体声音频数据;编码除了单声道和/或立体声音频数据之外的 扩展的多通道音频数据。单声道和/或立体声音频数据可具有分层的比特率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010122240.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有二次指向图形的麦克风阵列
- 下一篇:用于润滑支撑轴的轴承的轴承润滑装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置