[发明专利]使用高级频谱延拓降低量化噪声的压扩装置和方法有效

申请号：	201810160805.0	申请日：	2014-04-01
公开（公告）号：	CN108269586B	公开（公告）日：	2022-04-05
发明（设计）人：	P·何德林;A·比斯沃斯;M·舒格;V·迈勒考特	申请（专利权）人：	杜比实验室特许公司;杜比国际公司
主分类号：	G10L21/034	分类号：	G10L21/034;G10L25/18;G10L25/45;H03G7/00
代理公司：	中国贸促会专利商标事务所有限公司 11038	代理人：	刘前红
地址：	美国加***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	使用高级频谱延拓降低量化噪声装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及使用高级频谱延拓降低量化噪声的压扩装置和方法。压缩过程通过如下压缩过程来减小初始音频信号的原始动态范围：使用定义的窗形状将初始音频信号分成多个片段，使用初始音频信号的频域样本的基于非能量的平均在频域中计算宽带增益，以及施加个体增益值以放大相对低强度的片段和衰减相对高强度的片段。被压缩的音频信号然后通过施加逆增益值以放大相对高强度的片段和衰减相对低强度的片段，而被扩展回基本上原始动态范围。使用QMF滤波器组来分析初始音频信号以获得频域表示。

本申请是申请号为201480008819.0、申请日为2014年4月1日、发明名称为“使用高级频谱延拓降低量化噪声的压扩装置和方法”的发明专利申请的分案申请。

相关申请的交叉引用

本申请要求在2013年4月5日提交的美国临时专利申请No.61/809028以及在2013年9月12日提交的No.61/877167的优先权，其全文内容通过引用并入于此。

技术领域

一个或更多个实施例一般涉及音频信号处理，更具体地说，涉及使用压缩/扩展(压扩(companding))技术降低音频编解码器中的编码噪声。

背景技术

许多流行的数字声音格式利用丢弃数据中的一些来降低存储或数据速率要求的有损数据压缩技术。有损数据压缩的应用不仅降低源内容(例如，音频内容)的保真度，而且它也可能引入压缩伪影(artifact)形式的可察觉失真。在音频编码系统的背景下，这些声音伪影被称为编码噪声或量化噪声。

数字音频系统根据定义的音频文件格式或流媒体音频格式，利用编解码器(编码器-解码器组件)来压缩和解压缩音频数据。编解码器实现试图以最小的比特数表示音频信号同时保持尽可能高的保真度的算法。在音频编解码器中典型地使用的有损压缩技术在人类听觉感知的心理声学模型上工作。音频格式通常涉及时/频域变换(例如，修正离散余弦变换-MDCT)的使用，并且使用诸如频率掩蔽或时间掩蔽之类的掩蔽效应，使得包括任何明显的量化噪声的某些声音被实际内容隐藏或掩蔽。

大多数音频编码系统是基于帧的。在帧内，音频编解码器通常在频域中对编码噪声进行整形，使得它变得最难听得见。几种目前的数字音频格式利用这种长持续时间的帧，使得帧可以包含几个不同级别或强度的声音。因为编码噪声随着帧的演变在级别上通常是平稳的，所以编码噪声在帧的低强度部分期间可能是最能听得见。这种效应可以表现为预回声(pre-echo)失真，在该预回声失真中，高强度片段之前的静寂(或低级别信号)被解码的音频信号中的噪声淹没。这种效应可能在来自诸如响板或其他尖锐的打击声源之类的打击乐器的瞬态声音或脉冲中最显著。这种失真典型地由在频域中引入、在时域中遍布于编解码器的整个变换窗的量化噪声引起。

目前用于避免或最小化预回声伪影的措施包括使用滤波器。但是，这种滤波器引入相位失真和时间拖尾(temporal smearing)。另一种可能的解决方案包括使用较小的变换窗，但是这种方法可能显著地减小频率分辨率。

在背景技术部分中讨论的主题不应当仅仅因为在背景技术部分中提到了而被认为是现有技术。类似地，在背景技术部分中提及的或者与背景技术部分的主题相关联的问题不应当被认为在现有技术中已预先认识到。背景技术部分中的主题仅代表不同的方法，其自身也可以是发明。

发明内容

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司，未经杜比实验室特许公司;杜比国际公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810160805.0/2.html，转载请声明来源钻瓜专利网。

上一篇：使用高级频谱延拓降低量化噪声的压扩装置和方法
下一篇：光缆敲击信号显示方法及系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]使用高级频谱延拓降低量化噪声的压扩装置和方法有效

专利文献下载