[发明专利]对根据心理声学模型幅度小于掩蔽值的正弦信号有效编码的编码方法和设备以及对编码的正弦信号解码的解码设备和方法有效
申请号: | 200880103403.1 | 申请日: | 2008-05-27 |
公开(公告)号: | CN101779462A | 公开(公告)日: | 2010-07-14 |
发明(设计)人: | 李男淑;李健炯;李撤雨;文瀚吉 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | H04N7/24 | 分类号: | H04N7/24 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 韩明星;王青芝 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 根据 心理声学 模型 幅度 小于 掩蔽 正弦 信号 有效 编码 方法 设备 以及 解码 | ||
技术领域
本申请要求于2007年8月16日提交到韩国知识产权局的第 10-2007-82287号韩国专利申请的优先权,其公开完整地包含于此,以资参考。
与本发明一致的方法和设备总体涉及处理音频信号,更具体地讲,涉及 对根据心理声学模型(psychoacoustic model)幅度(magnitude)小于掩蔽值 (masking value)的正弦信号进行编码以及对编码的正弦信号进行解码。
背景技术
参数编码(parametric coding)通过特定参数表示音频信号,参数编码用 于运动图像专家组(MPEG)-4标准。
在参数编码中,通过执行三种类型的分析(即,瞬态分析、正弦分析和 噪声分析)提取在每个域中的音频分量的参数。将提取的分量格式化为比特 流以发送到解码器。
在正弦分析之后,对正弦信号进行跟踪以针对正弦信号进行自适应差分 脉冲编码调制(ADPCM)编码或差分脉冲编码调制(DPCM)编码。跟踪是 从包括在先前帧和下一帧中的正弦分量中搜索相互连续的正弦分量并设置找 到的正弦分量之间的对应关系的过程。
可从先前帧的正弦分量跟踪的当前帧的正弦分量称为连续(continuation) 正弦分量。由于可使用与连续正弦分量对应的先前帧的正弦分量对连续正弦 分量执行差分编码,所以可有效地对连续正弦分量进行编码。与下一帧的正 弦分量不连续并消失的连续正弦分量称作终止(death)正弦分量。
另一方面,无法从先前帧的正弦分量跟踪的当前帧的正弦分量称为新生 (birth)正弦分量。无法对新生正弦分量执行使用先前帧的正弦分量的差分 编码,并且可对新生正弦分量执行绝对编码。因此,新生正弦分量需要大量 比特以进行编码。
在对音频数据进行编码中,试图使用心理声学模型减少编码的数据的比 特数。图1A是解释根据心理声学模型的掩蔽效果的示图。
如图1A所示,当存在特定音频信号4时,人耳听不见信号幅度小于音 频信号4的幅度的声音。在特定音频信号4存在的情况下,表示人耳可听见 的信号的最小幅度的线被称作掩蔽曲线2,在特定频率处的掩蔽曲线2的值 被称为掩蔽值。
参照图1A,正弦信号6的幅度大于掩蔽值,因此人耳可听到正弦信号6。 因此,必须对正弦信号6进行编码。
另一方面,正弦信号8的幅度小于掩蔽值,因此人耳无法听到正弦信号 8。因此,在使用心理声学模型的编码中不对正弦信号8进行编码。换言之, 使用心理声学模型的编码将幅度比掩蔽值小的正弦信号处理为不存在。
图1B是解释在正弦跟踪中如何处置(treat)根据心理声学模型幅度比掩 蔽值小的正弦信号的示图。
参照图1B,正弦信号10具有根据心理声学模型小于掩蔽值的幅度。正 弦信号10的幅度小于在与正弦信号10相同帧中的正弦信号18和20的幅度。
当不应用心理声学模型时,正弦信号10与先前帧的正弦信号12和下一 帧的正弦信号14连接。因此,执行正弦信号12、正弦信号10和正弦信号14 的跟踪,因此可对正弦信号14执行可应用到连续正弦信号的差分编码。
然而,当应用心理声学模型时,如在空位置16中视为没有任何信号一样, 将幅度小于掩蔽值的信号视为不存在。
当应用心理声学模型时,将正弦信号10视为不存在,因此将正弦信号 14视为新生正弦信号,需要大量比特以进行编码。
如果将根据心理声学模型幅度比掩蔽值小的信号视为不存在,则必须将 下一帧的正弦信号作为新生正弦信号进行编码。
此外,即使对幅度小于掩蔽值的这些信号进行编码,仍出现问题。
图2是示出用于处理根据心理声学模型幅度小于掩蔽值的信号的现有方 法的流程图。
首先,在操作S10执行正弦跟踪。假设,作为正弦跟踪的结果,P(n-2) 与P(n-1)连接,P(n-1)与P(n)连接。
在操作S20,将P(n-1)假设为根据心理声学模型幅度小于掩蔽值的信号。 这样的信号可具有较小值或0的振幅(amplitude)。
在操作S30,根据应用或不应用心理声学模型的前述两种方法确定是否 对P(n-1)进行编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880103403.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于数据服务和漫游协议的动态网关选择
- 下一篇:电子镜装置