[发明专利]用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法有效
申请号: | 201180072006.4 | 申请日: | 2011-06-30 |
公开(公告)号: | CN103620674A | 公开(公告)日: | 2014-03-05 |
发明(设计)人: | 沃洛佳·格兰恰诺夫;西德格尔·思维里森 | 申请(专利权)人: | 瑞典爱立信有限公司 |
主分类号: | G10L19/032 | 分类号: | G10L19/032 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王玮 |
地址: | 瑞典斯*** | 国省代码: | 瑞典;SE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 信号 时间段 进行 编码 解码 变换 编解码器 方法 | ||
技术领域
本发明涉及对音频信号的时间段的编码和解码,具体地说,涉及变换音频编解码器中的编码和解码。
背景技术
先前已知使用变换域编码方案,例如,[1]中所描述的变换域编码方案。下面将给出这种变换域编码方案的高层次概述。
要编码的波形被逐块地变换到频域。用于该目的的一种常用的变换是所谓的修正离散余弦变换(MDCT)。由此获得的频域变换向量被划分为频谱包络(慢变能量)和频谱残差。通过使用所述频谱包络对获得的频域向量进行归一化来获得频谱残差。频谱包络被量化,并且量化索引被发送到解码器。接下来,量化的频谱包络用作比特分发算法的输入,并且基于频谱包络的特征来分发用于对残差向量进行编码的比特。作为该步骤的结果,特定数量的比特被指派给残差的不同部分(残差向量或“子向量”)。一些残差向量未接收到任何比特,并且必须对这些残差向量进行噪声填充或频带扩展,这一点在例如图1中被示出。通常,残差向量的编码是两步过程;首先,对向量元素的幅度进行编码,接下来,对非零元素的符号(sign)(符号不应当与“相位”混淆,而是与例如傅里叶变换相关联)进行编码,这一点在例如图2中被示出。针对残差的幅度和符号的量化索引被发送到解码器,在解码器处,残差和频谱包络被组合并且最后被变换回时域。
然而,当可用于编码的比特的数量有限(例如,处于低或中等比特率)时,编码的结果可能不令人满意。
发明内容
期望实现改善的变换域编码方案。本发明的目的是实现变换音频编码器中的有效编码和变换音频解码器中的相应解码。
根据第一方案,提供了一种在变换音频编码器中用于对音频信号的时间段进行编码的方法。所述方法包括:导出与所述音频信号的所述时间段相关联的残差向量在频率刻度中的位置的指示符z,并且导出与所述残差向量的结构量有关的度量Φ。所述方法还包括:确定是否满足涉及所述度量Φ、所述指示符z和预定义阈值Θ的预定义标准,这对应于估计在重构所述音频信号时间段之后所述残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的。对所述残差向量的所述系数的相应幅度进行编码,并且仅当确定满足所述标准因而符号改变将是可听的时,才对所述残差向量的系数的符号进行编码。
根据第二方案,提供了一种用于对音频信号的时间段进行编码的变换音频编码器。所述变换音频编码器包括:适配为导出与所述音频信号的所述时间段相关联的残差向量在频率刻度中的位置的指示符z并且导出与所述残差向量的结构量有关的度量Φ的功能单元。所述变换音频编码器还包括:适配为确定是否满足涉及所述度量Φ、所述指示符z和预定义阈值Θ的预定义标准的功能单元。所述变换音频编码器还包括:适配为对所述残差向量的系数的幅度进行编码,并且仅当确定满足所述标准时才对所述残差向量的系数的相应符号进行编码的功能单元。
上述方法和变换音频编码器可以用于实现音频信号的有效变换编码。与当使用先前已知的变换音频编码器时相比,当应用上述方法和变换音频编码器时,可能只需要较少的比特来对音频信号进行编码。尽管较少的比特被用于编码,但是与当使用先前已知的变换音频编码器时相比,重构的音频信号的感知质量并未降级。相反,节省的比特可以取而代之地用于对在可以利用增大的比特预算来进行编码时其感知质量可以得到改善的音频信号部分进行编码。因此,上述方法和布置实现了用于变换域音频编解码器的更有效的比特分发方案,这是因为比特可以向音频信号中对于重构的音频信号的感知质量更关键的信号参数移动。因此,可以在保持特定比特预算的同时实现整体质量改善。
根据第三实施例,提供了一种在变换音频解码器中用于对音频信号的编码时间段进行解码的方法。所述方法包括:对与所述音频信号的所述时间段相关联的变换向量的段的残差向量的系数的幅度进行解码。所述方法还包括:导出所述残差向量在频率刻度中的位置的指示符z,并且导出与所述残差向量的结构量有关的度量Φ。所述方法还包括:确定是否满足涉及所述度量Φ、所述指示符z和预定义阈值Θ的预定义标准,这对应于估计在重构所述音频信号时间段之后所述残差向量的非零系数中的至少一些非零系数的符号改变是否将是可听的。当确定满足所述标准(这对应于在重构的音频信号中符号改变将是可听的)时,对所述残差向量的系数的符号进行解码。当确定不满足所述标准因而在重构的音频信号中符号改变将是不可听的时,产生针对所述残差向量的非零系数的相应随机符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司,未经瑞典爱立信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180072006.4/2.html,转载请声明来源钻瓜专利网。