[发明专利]用于对音频信号进行译码的译码器和方法在审
申请号: | 201811631280.0 | 申请日: | 2014-02-20 |
公开(公告)号: | CN110047498A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 克里斯蒂安·黑尔姆里希;热雷米·勒孔特;戈兰·马尔科维奇;马库斯·施内尔;贝恩德·埃德勒;斯特凡·罗伊施尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/025 | 分类号: | G10L19/025 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;唐明英 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 窗口信息 音频信号 译码器 译码 可控转换器 频谱 时域表示 序列转换 处理器 相加 样本 转换 应用 | ||
一种用于对音频信号进行译码的译码器和方法。所述音频信号包括转换后的窗口化样本的块的序列及相关的窗口信息,窗口信息从至少三个不同的窗口中识别用于块的特定窗口。译码器包括:用于提供频谱值的块的序列的处理器;用于通过使用重叠‑相加处理将频谱值的块的序列转换成时域表示的可控转换器。可控转换器由窗口信息控制,以将由窗口信息表示的窗口应用至对应的块以计算译码后的音频信号。窗口选自包括至少三个窗口的组,三个窗口包括具有第一重叠长度的第一窗口、具有第二重叠长度的第二窗口、以及具有第三重叠长度或不具有重叠的第三窗口,其中第一重叠长度大于第二重叠长度,并且其中第二重叠长度大于第三重叠长度或大于零重叠。
本申请是国家申请号为201480009744.8,国际申请日为2014年2月 20日,进入国家日期为2015年8月20日,发明名称为“使用依赖瞬态 位置的重叠对音频信号编码或译码的设备及方法”的申请的分案申请。
技术领域
本发明是有关于对音频或图像信号的处理,且更特别是有关于对存在 瞬态的音频或图像信号的编码或译码,例如,通过使用依赖瞬态位置的重 叠对音频信号编码或译码的设备及方法。
背景技术
基于重叠FFT或改进的离散余弦变换(MDCT)的现代频域语音/音 频编码机制提供某些适应度给非静态信号特征。以MPEG标准化的通用 编译码器,亦即MPEG-1第三层,极著名为MP3,MPEG-4(HE-)AAC [1],以及最近的MPEG-0xHE-AAC(USAC)和由IETF[2]规定的Opus/Celt编译码器,允许使用至少两个不同的变换长度之中一个对帧 (frame)的编码-关于静态信号信道的一个长度M的长变换,或8个长 度M/8(每个)的短变换。在MPEG编译码器的情况下,从长到短及从 短到长变换的切换(亦称为块切换)需要使用非对称窗口化的瞬态变换, 亦即分别地是起始及停止窗口。这些变换形状以及其它已知的现有技术形 状描绘于图16中。应注意到,线性重叠斜率仅是说明性的并以正确的形 状变化。可能的窗口形状提供于AAC标准[1]及[3]的第6条中。
假定如果即将到来的帧待由MPEG编码器利用短变换来编码,则当 前帧必须利用起始瞬态变换来编码,显而易见的是一个依据其中一个上述 MPEG标准来实施的编码器需要至少预看(look-ahead)的帧长度。然而, 在低延迟通讯应用,理想上是可使此种额外预看最小化或甚至避免此种额 外预看。为此,对于通用编码模型的两个改进方案已被提出。一个改进方 案曾经被采用例如在Celt[2]中,用于将长变换的重叠减少至短变换的重 叠,从而能避免不对称瞬态窗口。另一被使用于例如MPEG-4(增强)低 延迟AAC编码机制的改进方案用于禁止切换至较短变换,替代地是依靠 时域噪声整形(TNS)编码工具[4],其操作于长变换数上以使围绕瞬态的 编码错误的时域伸展(temporal spread)最小化。
此外此外,类似xHE-AAC,低延迟AAC允许使用双帧重叠宽度-关 于静态输入是默认值50%重叠,或关于非静态信号的减少的重叠(类似 于瞬态变换的短重叠)。减少的重叠在系数量化的情况下有效地限制变换 的时间延伸,因而是其编码错误。
受让给三星(Samsung)电子公司的美国专利2008/0140428A 1以及 受让给索尼(Sony)公司的美国专利5502789及5819214揭露了信号适应 性窗口或变换尺寸确定单元。然而,由所述窗口或变换尺寸确定单元所控 制的变换器单元,操作于QMF或LOT子频带值(表示所说明的系统都 采用串接型滤波器组或变换),相对于如在本情况下的直接地工作于时域 全频带输入信号上。此外,于2008/0140428A 1中,并未详细说明关于形 状或窗口重叠的控制的细节,且在5819214中,重叠形状遵循(亦即,为 以下的结果)来自变换尺寸确定单元的输出,这是本发明所提出的较佳实 施例的相对内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811631280.0/2.html,转载请声明来源钻瓜专利网。