[发明专利]用于针对合成统一语音和音频编解码器(USAC)处理音频信号和提供较高时间粒度的设备和方法有效
申请号: | 201180058880.2 | 申请日: | 2011-10-04 |
公开(公告)号: | CN103403799A | 公开(公告)日: | 2013-11-20 |
发明(设计)人: | 马库斯·穆赖特鲁斯;伯恩哈德·格里;马克思·纽恩多夫;尼古劳斯·雷特尔巴赫;纪尧姆·福奇斯;菲利普·古尔纳伊;罗什·勒菲弗;布鲁诺·贝塞特;斯特凡·维尔德 | 申请(专利权)人: | 弗兰霍菲尔运输应用研究公司;声代有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/02;G10L21/04 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚;吴孟秋 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 针对 合成 统一 语音 音频 编解码器 usac 处理 信号 提供 时间 粒度 设备 方法 | ||
技术领域
本发明涉及音频处理,具体地,涉及一种用于针对合成统一语音和音频编解码器(USAC)来处理音频信号和提供较高时间粒度的设备和方法。
背景技术
与其他音频编解码器一样,USAC表现为固定帧大小(USAC:2048样本/帧)。尽管有在一个帧内切换成较短变换大小的有限集合的可能性,但帧大小仍限制整个系统的时间分辨率。对于传统音频编解码器,为提高整个系统的时间粒度,要增加采样率,从而导致时间上一个帧的持续时间缩短(例如,毫秒)。然而,这对于USAC编解码器并非简单可行:
USAC编解码器包括来自传统一般音频编解码器的工具(诸如AAC(高级音频编码)变换编码器、SBR(谱带复制)和MPEG环绕(MPEG=动画专家组))加上来自传统语音编码器的工具(诸如ACELP(ACELP=代数码激励线性预测))的组合。ACELP和变换编码器二者通常在相同环境(即,帧大小、采样率)内的相同时间运行,且可很容易被切换:通常对于清晰语音信号,使用ACELP工具;以及对于音乐、混合信号,使用变换编码器。
ACELP工具在相同时间受限于仅以相对较低的采样率工作。对于24kb/s,使用仅17075Hz的采样率。对于较高采样率,ACELP工具性能上开始显著降低。然而,变换编码器以及SBR和MPEG环绕将从较高的采样率获益,例如,针对变换编码器的22050Hz以及针对SBR和MPEG环绕的44100Hz。然而,到目前为止,ACELP工具限制了整个系统的采样率,从而导致了尤其对于音乐信号的非最佳系统。
本发明的目的在于提供对用于处理音频信号的设备和方法的改进概念。本发明的目的由根据权利要求1所述的设备、根据权利要求15所述的方法、根据权利要求16所述的设备、根据权利要求18所述的方法以及根据权利要求19所述的计算机程序来解决。
目前的USAC RM在范围从非常低的位率(诸如8kb/s)直到以128kb/s以上的位率的透明质量的大量操作点上提供高编码性能。为达到在这一较宽位率范围内的这种高质量,使用诸如MPEG环绕、SBR、ACELP和传统变换编码器的工具的组合。这种工具的组合自然要求工具互操作的联合最佳化处理和放置这些工具的共享环境。
在该联合最佳化处理中发现,有些工具具有再现信号的缺陷,这些信号暴露出在中间位率范围(24kb/s-32kb/s)的高时间结构。具体地,MPEG环绕、SBR和FD变换编码器(FD、TCX)(FD=频域;TCX=变换编码激励)等工具,即在频域操作的所有工具,可在以与时域的较短帧大小相同的较高时间粒度操作时表现较佳。
相比现有技术的HE-AACv2编码器(高效率AAC v2编码器)的状态,发现目前的USAC参考质量编码器以显著较低的采样率、诸如24kb/s和32kb/s的位率来操作,同时使用相同的帧大小(样本中)。这意味着以毫秒计的帧的持续时间明显较长。为补偿这些缺陷,需增加时间粒度。这可通过提高采样频率或缩小(例如,使用固定帧大小的系统的)帧大小来达到。
然而,提高采样频率对于SBR和MPEG环绕提高针对时间动态信号的性能是合理的方式,这对于全部核心编码器工具将是无效的:众所周知,较高采样频率将有利于变换编码器,但同时急剧降低ACELP工具的性能。
发明内容
提供了一种用于处理音频信号的设备。该设备包括信号处理器和配置器。所述信号处理器适用于接收具有所述音频信号的第一可配置的样本数目的第一音频信号帧。此外,所述信号处理器适用于利用可配置上采样因子来上采样所述音频信号以获得所处理的音频信号。此外,所述信号处理器适用于输出具有所述所处理的音频信号的第二可配置的样本数目的第二音频信号帧。
所述配置器适用于基于配置信息来配置所述信号处理器,使得当所述第二可配置的样本数目与所述第一可配置的样本数目的第一比具有第一比值时,所述可配置上采样因子等于第一上采样值。此外,所述配置器适用于配置所述信号处理器,使得当所述第二可配置的样本数目与所述第一可配置的样本数目的不同的第二比具有不同的第二比值时,所述可配置上采样因子等于不同的第二上采样值。所述第一比值或所述第二比值不是整数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司;声代有限公司,未经弗兰霍菲尔运输应用研究公司;声代有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180058880.2/2.html,转载请声明来源钻瓜专利网。