[发明专利]一种基于TDA域的自适应窗切换方法无效
申请号: | 200910235903.7 | 申请日: | 2009-10-29 |
公开(公告)号: | CN101694773A | 公开(公告)日: | 2010-04-14 |
发明(设计)人: | 王晶;陈博;赵胜辉;匡镜明 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 郭德忠;杨志兵 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 tda 自适应 切换 方法 | ||
技术领域
本发明涉及一种基于TDA域的窗切换方法,尤其是一种适合于暂态信号经过时域混叠(TDA,Time Domain Aliasing)处理后的多分辨率分析方法,属于音频编码技术领域。
背景技术
音频信号从时域波形的瞬变和缓变上可分为暂态和稳态信号,暂态信号例如敲打乐器的声音因其能量突发且时间短暂,在音频编码处理中需要较高的时域分辨率;而稳态信号时间上变化较平稳但频谱上较丰富,需要有较高的频域分辨率。现有的音频编码器大多采用感知变换编码方式,例如MPEG提出的MP3、AAC系列音频编码标准均采用改进的离散余弦变换(MDCT,Modified Discrete Cosine Transform),基于人耳听觉特性对音频信号进行时频变换,对稳态信号用长窗分析来获得较好的频域分辨率;而为避免量化噪声均匀扩散到整个时域,尤其是暂态信号出现之前的那段信号,对暂态信号用短窗分析来消除预回声失真。
2006年3GPP基于MPEG的AAC编码器(标准号:ISO/IEC 14496-3)提出增强的高级音频编码标准EAAC+(标准号:3GPP TS 26.401),基于MDCT变换,进行暂态帧检测,采用长短窗切换的方法来实现稳态和暂态的可变分辨率分析,并通过引入时域噪声整形(TNS,Time Noise Shaping)模块消除暂态编码预回声。美国公开号为6424939(公开日:2008年1月29号)的专利预先计算相邻两帧信号的MDCT系数,基于MDCT系数计算感知参数来决定当前帧信号是稳态的或暂态的,并相应采用长窗或短窗,在较低的复杂度下提高当前帧的暂、稳态判断的精度,进而提升重建音频的质量。我国公开号为CN101308656A(公开日:2008年11月19日)的专利对检测出的暂态信号处理采用稳态和暂态信号帧之间进行长短窗切换方法,将暂态部分时域采样点进行伸缩处理后进行时-频变换编码来减少量化比特数和计算复杂度。
如上所述,现有的音频编码技术大多采用了时域上对音频信号帧之间进行长短窗切换的方法进行分析,将检测出的每帧暂态信号用固定窗长的短窗进行处理。这种方式有两个主要的问题:一是对于时域的当前帧而言采用固定长度的窗长处理方式使得时频分辨率在本帧内受限,其时频分析的分辨率无法保证合适,从而导致预回声在时域扩展,重建信号的质量下降;二是长短窗切换时大多使用过渡窗,这需要同时获得时域的相邻两帧信号的暂态分析结果来判断出何时使用过渡窗,因此增加了算法时延,限制了编码器在实时通信场合的应用。因此为了进一步控制预回声,提升质量,需要更准确的时频分辨率分析,尤其是对于暂态和稳态混合的情况,暂态突发处应有较短的处理窗长,稳态部分应有较长的处理窗长,这就需要对检测出的暂态音频进行自适应的窗长调整,并进行相应的窗型切换和过渡。2008年ITU-T提出一种低复杂度全频带音频编码标准G.722.1-FB(标准号:ITU-T G.719),采用TDA时域混叠结合DCT-IV型快速算法实现MDCT时频分析,对检测出的暂态帧信号在TDA域划分为固定窗长度的4个子帧并进行MDCT分析;每帧信号进行TDA时域混叠操作后采样点个数降为一半,这种在TDA域对音频信号进行时频分析的方法其延迟固定,并有利于降低算法的计算复杂度,部分解决了前述采用时域长短窗切换的方法在音频信号中的暂态信号处理中的问题。但该标准对TDA域信号采用固定的4子帧窗切换模式不能很好的减少预回声失真,且不适合暂态和稳态混合情况的处理。
发明内容
为了解决音频信号中混有暂态和稳态信号时,时频分析效果存在分辨率无法适应需求,导致预回声且使重建信号的质量下降的问题,本发明公开了一种在TDA域进行多分辨率分析的自适应窗切换处理方法,以此改善现有音频标准(ITU-T G.719)对暂态信号的时频分析效果,相比现有的每帧暂态信号在TDA域采用固定长度4子帧的窗切换模式(ITU-T G.719),能够进一步降低音频信号中暂态信号的预回声失真,并有利于提高暂态和稳态混合等复杂情况下的音频编码质量。
为了达到上述目的,在本发明技术方案中,根据TDA域暂态出现的位置和时频分析效果选择不同的窗切换模式,将经过时域混叠(TDA,Time Domain Aliasing)操作后的暂态信号划分为相互交叠的长度可变的子帧进行时频分析。本发明采用开环策略判断TDA域中的暂态信号出现位置并进行窗切换模式的粗筛选;采用闭环策略选择时频分析最佳的窗切换模式,实现TDA域的长短窗间的切换与过渡,从而通过开环和闭环相结合的策略找到合适的窗型来进行最佳的时频分辨率分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910235903.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种喷粉枪
- 下一篇:CMOS摄像头转接装置