[发明专利]低比特率音频信号解码方法有效

申请号：	201210441382.2	申请日：	2006-07-14
公开（公告）号：	CN103106902A	公开（公告）日：	2013-05-15
发明（设计）人：	金重会;吴殷美;康斯坦丁·奥斯波夫;波利斯·库德里亚索夫	申请（专利权）人：	三星电子株式会社
主分类号：	G10L19/02	分类号：	G10L19/02;G10L19/035
代理公司：	北京铭硕知识产权代理有限公司 11286	代理人：	王艳娇
地址：	韩国京畿***	国省代码：	韩国;KR
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	比特率音频信号解码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请是申请日为2006年7月14日、申请号为200680025920.2、题为“从音频信号提取重要频谱分量的方法和设备以及使用其的低比特率音频信号编码和/或解码方法和设备”的专利申请的分案申请。

技术领域

本发明总体发明构思涉及一种音频信号编码和/或解码系统，更具体地讲，涉及一种提取音频信号的重要频谱分量的方法和设备以及使用其的对低比特率音频信号编码和解码的方法和设备。

背景技术

“MPEG(运动图像专家组)音频”是用于高质量高性能立体声编码的ISO/IEC标准。MPEG音频与运动图像编码根据MPEG的ISO/IEC SC29/WG11一起被标准化。对于MPEG音频，基于32个频带的子带编码(频带分解编码)和改进离散余弦变换(MDCT)用于压缩，具体地讲，通过使用心理特征执行高性能压缩。与传统压缩编码方案相比，MPEG音频可实现高质量的声音。

为了高性能地压缩音频信号，MPEG音频利用“感知编码”压缩方案以减小音频信号的压缩量，在该“感知编码”压缩方案中，通过使用感测音频信号的人类的敏感特性来去除详细的低敏感信息。

此外，在MPEG音频中，无声阶段的最小可听限制和掩蔽特性主要用于使用听觉心理特征的感知编码。无声阶段的最小可听限制是听觉可感知的声音的最小级别。最小可听限制与在无声阶段听觉可感知的噪声的限制有关。最小可听限制根据声音的频率改变。在一些频率，可听到比最小可听限制高的声音，但是在另一些频率，可能不会听到比最小可听限制低的声音。此外，特定声音的感测限制可根据与该特定声音一起听到的其他声音大大改变。这被称为“掩蔽效应”。发生掩蔽效应的频率的宽度被称为临界带。为了有效地利用听觉心理特征(例如，临界带)，将声音信号分解为频谱分量很重要。为此，频带被分为32个子带，随后执行子带编码。另外，在MPEG音频中，滤波器组用于消除32个子带的混叠噪声。

发明内容

技术问题

MPEG音频包括使用滤波器组和心理声学模型的比特分配和量化。通过MDCT产生的系数分配有最佳量化比特，并且通过使用心理声学模型2被压缩。用于分配最佳比特的心理声学模型2通过使用扩散函数基于FFT来估计掩蔽效应。因此，需要相对大量的复杂度。

通常，对于低比特率(32kbps或更少)音频信号的压缩，可分配给信号的比特数不足以量化音频信号的所有频谱分量及其无损编码。因此，需要提取感知的重要频谱分量(ISC)和量化及其无损编码。

技术方案

本发明总体发明构思提供一种从音频信号提取重要频谱分量以低比特率压缩音频信号的方法和设备。

本发明总体发明构思还提供一种使用从音频信号提取重要频谱分量的方法和设备的低比特率音频信号编码方法和设备。

本发明总体发明构思还提供一种对通过低比特率音频信号编码方法和设备编码的低比特率音频信号解码的低比特音频信号解码方法和设备。

将在接下来的描述中部分阐述本发明另外的方面和优点，还有一部分通过描述将是清楚的，或者可以经过本发明总体发明构思的实施而得知。

可通过提供一种提取音频信号的重要频谱分量(ISC)的方法来实现本发明总体发明构思的前述和/或其他方面和优点，该方法包括：通过使用心理声学模型计算包括变换的频谱音频信号的信号掩蔽比(SMR)值的感知重要性，使用SMR值将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为第一ISC；根据预定权重因数从选作为第一ISC的频谱音频信号提取频谱峰值以选择第二ISC。可通过使用权重因数将被获得的当前信号的频率附近的预定数量的频谱值获得权重因数。

该方法还可包括获得频带的SNR(信噪比)；和将具有低SNR的频带中峰值大于预定值的频谱分量选作为ISC。

还可通过提供一种提取音频信号的重要频谱分量(ISC)的方法来实现本发明总体发明构思的前述和/或其他方面和优点，该方法包括：通过使用心理声学模型计算包括变换的频谱音频信号的SMR(信号掩蔽比)值的感知重要性；使用SMR将掩蔽阈值小于所述频谱音频信号的掩蔽阈值的频谱音频信号选作为第一ISC；和获得选作为第一ISC的频谱音频信号中的频带的SNR以将具有低SNR的频带中峰值大于预定值的频谱分量的频谱音频信号选作为另一ISC。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于三星电子株式会社，未经三星电子株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210441382.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种橙皮甙含量的测定方法
下一篇：一种相变材料快速自动化热循环实验仪器

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]低比特率音频信号解码方法有效

专利文献下载