[发明专利]延迟优化的重叠变换,编码/解码加权窗口有效
申请号: | 201280042901.6 | 申请日: | 2012-06-26 |
公开(公告)号: | CN103930946A | 公开(公告)日: | 2014-07-16 |
发明(设计)人: | 朱利恩·福雷;皮埃里克·菲利普 | 申请(专利权)人: | 奥兰吉公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/032 |
代理公司: | 上海天协和诚知识产权代理事务所 31216 | 代理人: | 童锡君 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 延迟 优化 重叠 变换 编码 解码 加权 窗口 | ||
技术领域
本发明涉及数字音频信号的编/解码领域,更具体地涉及所谓的“具有重叠的变换音频编/解码”领域。
背景技术
“变换编码”在于在变换(频率)域中编码时域信号。此变换尤其使得能够使用音频信号(音乐,语音等)的频率特性,以便优化并提高编码效率。例如,可应用这一事实:谐波声音在频域中由有限且少量的光谱波表示,因此它可被简洁地编码。例如,还可有利地应用频率掩蔽效应,以尽可能无声的方式格式化编码噪声。
标准变换编码技术被总结如下。
要被编码的数字音频流(以指定采样频率Fs)被分割成有限数量样本2M的帧(或更一般的称为“块”)。每个帧常规来说与在前帧重叠50%。加权窗口ha(被称为“分析窗口”)被应用至每个帧。
然后,变换被应用至该信号。在被称为“MDCT”(“修正的离散余弦变换”)的变换的情况下,并在特定实施方式中,依据2M样本至M样本的变换,加权的帧被“折叠”。然后,IV类型的DCT变换应用至被折叠的帧以便获得在变换域中的大小为M的帧。
然后使用适当的量化器量化变换域中的帧。量化使得能够减少数据的大小,却将噪声(听得见或听不见的)引入原始帧中。编码器的比特率越高,此噪声被减小的越多并且量化的帧越接近原始帧。
在解码中,逆MDCT变换然后被应用至量化的帧。使用逆IV类型的DCT,大小为M的量化的帧被变换为时域中的大小为M的帧。第二个,M至2M的“展开”变换然后被应用至大小为M的暂时帧。
所谓的“合成”加权窗口hs然后被应用至大小为2M的帧。
然后通过聚集重叠的部分合成解码的音频流。
对于合成窗口和指定的重叠,确定分析窗口使得能够获得要编码信号的完美重构(在不量化的情况下)。
在变换编码中惯常使用的窗口是正弦曲线类的窗口,在分析和合成两者中都是相同的。在这一配置下,由编码系统引入的最小算法延迟是2M/Fs秒。
为了减少这一延迟,能够在合成窗口的开始以及在分析窗口的末端加入多个零值。由于该信号与“0”的乘法运算的结果提前已知,能够相对于窗口的位置偏移帧率。这些对称窗口,例如由以下元素组成:
-一定数量的零值Mz,它延伸在对应于要解决的算法延迟一半的间隔上,
-长度为M-2Mz的正弦曲线上升部分,
-值为1的2Mz部分,
-如附图1所示的最终作为第一半窗口的对称反映的第二半窗口。
这些窗口具有(2M-2Mz/Fs)秒的算法延迟并因此使得能够减少延迟2Mz/Fs秒。
然而,这一技术,尽管它使得能够减少延迟,当延迟的减少增加时,确实倾向于类似矩形窗口。这一窗口形式的频率选择性并不特别强并且基本上彻底降低了编码信号的音频质量。此外,它极大限制了窗口,这是由于在它的构建中加入了4Mz样本。对于提供用于编码的有效窗口,尤其是以提供显著的频率可选性来说,没有很多可用的自由度。。
文献WO-2009/081003已经提出使用非对称窗口以减轻这一问题。这些窗口,根据分析,由覆盖分析窗口末端的多个0组成。为了限制所需的存储空间,合成窗口被选择为分析窗口的时域翻转。此技术尤其使得能够减少编码延迟,以及解码延迟。对于总数为Mz的零来说,其小于在前描述的同步窗口的零的总数的二分之一,延迟改善相同。给定减少数量的零,这种非对称窗口的频率选择性高于对称窗口的频率选择性。解码信号的音频质量因此被增强。
更具体的,文献WO-2009/081003呈现了分析窗口由来自于下式给出的初始窗口h(n)的两部分ha1和ha2组成的ha(n):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥兰吉公司,未经奥兰吉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280042901.6/2.html,转载请声明来源钻瓜专利网。