[发明专利]一种空间参数立体声编解码方法及其装置无效
申请号: | 200710053770.2 | 申请日: | 2007-11-06 |
公开(公告)号: | CN101162904A | 公开(公告)日: | 2008-04-16 |
发明(设计)人: | 胡瑞敏;陈水仙;艾浩军;涂卫平;曹晟;王恒;李璇;周婷 | 申请(专利权)人: | 武汉大学 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;H04S3/00 |
代理公司: | 武汉天力专利事务所 | 代理人: | 冯卫平;程祥 |
地址: | 43007*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 空间 参数 立体声 解码 方法 及其 装置 | ||
技术领域
本发明属于数字音频压缩编码领域,特别涉及一种以参数表示空间信息的立体声编解码系统和装置。
背景技术
数字音频编码起源于20世纪80年代末,以MP3(MPEG-1 Layer III)和AAC(Advanced Audio Coding)为典型代表。此时编码技术在立体声的处理方面考虑声道间的相关性,采用和差(Mid/Side)立体声或强度立体声(Intensity Stereo)处理技术,然后对处理后的两路完整的音频信号采用独立的编码方法,因此码率与声道数基本成正比。
2002年C.Faller等人提出了一种基于空间心理声学的参数立体声编解码系统BCC(Binaural Cue Coding)。此系统在变换域提取声道间强度差ILD(Interchannel Level Difference),声道间时间差ITD(Interchannel Time Difference),和声道间相关度IC(Interchannel Coherence),其解码器根据这些参数和下混声道重建多声道的输出。2004年J.Breebaart等人提出参数立体声PS(Parametric Stereo)编解码系统,2005年MPEG推出MPEG环绕声(MPEG Surround)系统都是以BCC为基础发展起来的立体声/多声道编解码系统,其核心架构与BCC系统一致。
上述空间参数编解码系统相对于只采用和差立体声和强度立体声技术的MP3/AAC等编解码系统,在性能上有明显的提升:以单声道的码率达到立体声的音质,因此在对音质和码流要求严格的音频广播和移动音频中得到应用。但是这些空间参数编解码系统最突出的问题是延时增加,编解码端的时频分析模块引入了至少一帧的延时,通常在20ms到40ms之间,不利于双向实时通信。因此减小空间参数立体声编解码的延时是本领域亟待解决的问题。
BCC、PS、和MPEG Surround的另一个问题是难于实现动态的时频划分。根据空间心理声学,ILD、ITD、和IC只有针对同一或空间上连续的声源才有明确的意义。上述空间参数编码系统都采用子带划分的方式来区分信号中不同的声源进而提取空间参数,为了避免传送子带划分信息带来的码率增加,这种划分是静态的且独立于信号特性的。由于实际信号中各个声源的频谱范围是动态的,这种方式降低了空间参数编码的效率。因此在不增加码率的情况下实现动态的时频划分是本领域亟待解决的另一个问题。
发明内容
本发明的目的在于解决现有空间参数编解码系统的不足,提供一种无附加延时且支持动态时频划分的空间参数立体声编解码方法及其装置,减少系统延时并提高立体声信号压缩的效率。
本发明的编码技术解决方案包括以下步骤:
步骤1,对输入的左右两路时域音频信号进行下混,生成一路信号;
步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据;
步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱;
步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;
步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的空间参数信息,生成空间参数编码数据;
步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路编码码流。
而且,步骤1所述的下混是在时域操作,即取左右两路音频信号的时域平均值作为下混信号,其中时域平均值是两路信号在同一时刻处的样点值之和的一半。
而且,步骤1所述的下混是在频域操作,即取左右两路音频信号的频域平均值或乘以增益系数,得到频域下混信号,其中频域平均值是两路信号在同一频点处的谱线值之和的一半,增益系数是为了调整下混信号能量而在平均值之上乘的一个正的实数。
而且,步骤3所述的下混信号的反量化频谱,通过对下混信号的编码数据进行解码获得;或者当变换编码过程中生成了下混信号的反量化频谱时,直接从编码过程中获得。
本发明还提供了相应的空间参数立体声解码方法,依次包含以下步骤:
步骤I,将合成码流分离成下混信号编码数据和空间参数编码数据;
步骤II,对下混信号编码数据进行变换音频解码,生成频域反量化的下混信号,同时将此信号的频谱划分成若干连续且无重叠的子带;
步骤III,根据空间参数编码数据和频域反量化的下混信号,以步骤II划分的子带为单位,生成两路包含频域音频信号,这两路频域音频信号包含空间参数编码数据给定的空间信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710053770.2/2.html,转载请声明来源钻瓜专利网。