[发明专利]对比特流进行解码的音频解码器设备和方法有效
申请号: | 201480059424.3 | 申请日: | 2014-10-30 |
公开(公告)号: | CN105706166B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 萨沙·迪施;马库斯·马特拉斯;本杰明·舒伯特;马库斯·施内尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/03 | 分类号: | G10L19/03;G10L19/24 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李敬文 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 比特流 进行 解码 音频 解码器 设备 方法 | ||
本发明提供了一种对比特流进行解码的音频解码器设备,所述音频解码器设备包括:比特流接收机,配置为接收比特流并从所述比特流获得编码音频信号;核解码器模块,配置为从编码音频信号获得时域上的解码音频信号;时间包络产生器,配置为确定解码音频信号的时间包络;带宽扩展模块,配置为产生频域带宽扩展信号,其中带宽扩展模块包括配置为在时域上产生噪声信号的噪声产生器,其中带宽扩展模块包括预整形模块,配置用于根据解码音频信号的时间包络对噪声信号进行时间整形以便产生整形后的噪声信号,以及其中带宽扩展模块包括时频转换器,配置为将整形后的噪声信号变换为频域噪声信号;其中频域带宽扩展信号依赖于频域噪声信号;时频转换器,配置为将解码音频信号变换为频域解码音频信号;组合器,配置为组合频域解码音频信号和频域带宽扩展信号,以便产生带宽扩展的频域音频信号;以及频时转换器,配置为将带宽扩展的频域音频信号变换为带宽扩展的时域音频信号。
技术领域
本发明涉及语音和音频编码,具体地,涉及音频带宽扩展(BWE)。
背景技术
带宽扩展技术关注于通过使音频编解码器的有效输出带宽变宽,来增强音频编解码器的感知质量。代替用底层核编码器进行全带宽范围编码,使用带宽扩展技术的编解码器允许在感知上较不重要的高频(HF)范围内消耗较少比特。因此,可将更多的比特提供给核编码器来以更高精度处理更重要的低频(LF)范围。为此,带宽扩展技术被广泛用于需要以低比特率来实现适当感知质量的编解码器。
通常,存在两种不同的基本带宽扩展方法,需要区分如下:盲目式带宽扩展和引导式带宽扩展。在盲目式带宽扩展中,不发送附加的边信息。因此,仅通过使用从核编码器的解码LF信号获得的信息,来产生要在解码器侧插入的HF内容。由于不需要传输高昂的边信息,盲目式带宽扩展技术非常适于以最低比特率操作的编解码器或后向兼容后处理过程。另一方面,缺少可控性仅允许使用盲目式带宽扩展对带宽进行相对较小的有效扩展(例如,【1】中的6.4-7.0kHz)。与盲目式方法相反,在引导式带宽扩展中,通过使用在编码器侧提取的并在比特流中被发送到解码器作为边信息的参数,来重构HF内容。因此,引导式带宽扩展使得能够更好地控制HF重构,从而可能呈现较宽的有效带宽。由于额外的比特消耗,引导式带宽扩展技术通常用于以较高比特率操作的编解码器,作为结合盲目式带宽扩展的系统。
更具体地,存在不同的方法来实现带宽扩展:
在语音编码中,通常使用基于源-滤波器模型的带宽扩展方法,所述方法与它们的底层核编码器紧密相关,例如,在G.722.2(AMR-WB)【1】中。在AMR-WB中,通过向激励域中注入白噪声,ACELP(代数编码激励线性预测)核编码器的输出带宽6.4kHz被扩展到7.0kHz。然后,通过从核编码器的线性预测(LP)滤波器获得的滤波器对扩展后的激励进行整形。根据比特率,通过仅使用核编码器信息来估计用于对插入噪声进行缩放的增益,或在编码器中提取所述增益并进行发送。这种带宽扩展方法严重依赖于它的底层编码方案,这是由于使用它的合成机制,因此,附加地必须在相同域内执行。
音频编码中公知的独立于带宽扩展技术的核编码器是频带复制(SBR)【2】。与先前示例相反,可以独立于底层核编码器来应用频带复制。作为第一步,在编码器侧将输入信号分为LF部和HF部,例如,通过使用正交镜像滤波器分析滤波器组(QMF)。当通过频带复制处理HF部时,将LF部馈送给核编码器。因此,提取描述HF信号的时间-频率包络的参数以及HF信号相对LF信号的调性/噪声特性,并进行发送。在解码之后,通过使用与编码器中使用的相同类型的分析滤波器组,对所述信号进行变换。为了重构HF内容,考虑到所发送的参数,对解码信号逐部分地进行拷贝、镜像或变调到HF范围,后处理以便与原始的、且时间上和频率上整形后的音调性/噪声特性相匹配。然后,通过相应的合成滤波器组,产生时域输出信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480059424.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:有语音的话音检测方法和装置
- 下一篇:用于噪声减轻的方法及电子装置
- 同类专利
- 用于使用基于预测的整形后处理音频信号的装置和方法-201880036642.3
- 萨沙·迪施;克里斯蒂安·乌勒;于尔根·赫勒;彼得·普罗肯;帕特里克·甘普;安东尼奥·卡拉姆伯尼欧蒂斯;茱莉亚·哈文斯坦;奥利弗·赫尔穆特;丹尼尔·里奇特 - 弗劳恩霍夫应用研究促进协会
- 2018-03-29 - 2023-08-15 - G10L19/03
- 一种用于后处理(20)音频信号的装置,包括:时间频谱转换器(700),用于将音频信号转换为包括频谱帧序列的频谱表示;预测分析器(720),用于计算用于对频谱帧内的频率的预测的预测滤波器数据;由预测滤波器数据控制的整形滤波器(740),用于对频谱帧进行整形以增强频谱帧内的瞬态部分;以及频谱时间转换器(760),用于将包括经整形的频谱帧的频谱帧序列转换到时域中。
- 时域噪声整形-201880086260.1
- 伊曼纽尔·拉维利;曼福莱特·卢次克;马库斯·施奈尔;亚历山大·切卡林斯基;格兰·马尔科维奇;斯特凡·盖尔斯伯格 - 弗劳恩霍夫应用研究促进协会
- 2018-11-06 - 2023-08-04 - G10L19/03
- 存在用于执行时域噪声整形的所论述方法和装置。一种装置可包括:时域噪声整形TNS工具(11),其用于对包括多个帧的信息信号执行线性预测LP滤波(S33,S35,S36);以及控制器(12),其被配置为控制所述TNS工具(11),使得所述TNS工具(11)利用以下执行LP滤波:第一滤波器(14a),其脉冲响应具有较高能量(S36);以及第二滤波器(15a),其脉冲响应具有低于所述第一滤波器的能量(S35),其中所述第二滤波器并非恒等滤波器,其中所述控制器(12)被配置为基于帧量度在利用所述第一滤波器(14a)进行滤波(S36)与利用所述第二滤波器(15a)进行滤波(S35)之间进行选择(S34)。
- 对比特流进行解码的音频解码器设备和方法-201480059424.3
- 萨沙·迪施;马库斯·马特拉斯;本杰明·舒伯特;马库斯·施内尔 - 弗劳恩霍夫应用研究促进协会
- 2014-10-30 - 2020-07-14 - G10L19/03
- 本发明提供了一种对比特流进行解码的音频解码器设备,所述音频解码器设备包括:比特流接收机,配置为接收比特流并从所述比特流获得编码音频信号;核解码器模块,配置为从编码音频信号获得时域上的解码音频信号;时间包络产生器,配置为确定解码音频信号的时间包络;带宽扩展模块,配置为产生频域带宽扩展信号,其中带宽扩展模块包括配置为在时域上产生噪声信号的噪声产生器,其中带宽扩展模块包括预整形模块,配置用于根据解码音频信号的时间包络对噪声信号进行时间整形以便产生整形后的噪声信号,以及其中带宽扩展模块包括时频转换器,配置为将整形后的噪声信号变换为频域噪声信号;其中频域带宽扩展信号依赖于频域噪声信号;时频转换器,配置为将解码音频信号变换为频域解码音频信号;组合器,配置为组合频域解码音频信号和频域带宽扩展信号,以便产生带宽扩展的频域音频信号;以及频时转换器,配置为将带宽扩展的频域音频信号变换为带宽扩展的时域音频信号。
- 专利分类