[发明专利]娱乐音频中的语音增强有效

专利信息
申请号: 200880009929.3 申请日: 2008-02-20
公开(公告)号: CN101647059A 公开(公告)日: 2010-02-10
发明(设计)人: H·米施 申请(专利权)人: 杜比实验室特许公司
主分类号: G10L11/02 分类号: G10L11/02;G10L21/02;H04R25/00
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 杨国权
地址: 美国加*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 娱乐 音频 中的 语音 增强
【权利要求书】:

1.一种用于增强娱乐音频中的语音的方法,包括:

响应于一个或多个控制,处理所述娱乐音频以提高所述娱乐音频 中的语音部分的清晰度和可懂度,所述处理包括:

根据将频带信号电平与增益相关联的增益特性在多个频带 的每个中改变娱乐音频的电平,其中,所述增益特性对于大于扩展阈 值的估计电平具有扩展率,以及

生成用于在每个频带中改变所述增益特性的控制,所述生成 包括:

将所述娱乐音频的时间区段特征化为(a)语音或非语音 或(b)可能是语音或非语音,

响应于所述娱乐音频的电平的变化而提供对所述处理的 控制,其中这种变化在比所述时间区段短的时间段中被响应,并且所 述响应的判定准则由所述特征化来控制,

其中,当所述娱乐音频被特征化为语音或可能是语音时, 所述扩展阈值被降低,而当所述娱乐音频被特征化为非语音或可能是 非语音时,所述扩展阈值被提高。

2.如权利要求1所述的方法,其中,存在对在处理点之前和之 后的娱乐音频的时间演进的访问,并且所述生成用于在每个频带中改 变所述增益特性的控制响应于所述处理点之后的至少某个音频。

3.如权利要求1所述的方法,其中,所述处理根据一个或多个 处理参数操作。

4.如权利要求3所述的方法,其中,一个或多个参数的调整响 应于娱乐音频,使得被处理的音频的语音可懂度的度量或者被最大化, 或者被促使高于所希望的阈值级别。

5.如权利要求4所述的方法,其中,娱乐音频包括多个音频频 道,其中一个频道主要是语音,以及一个或多个其他频道主要是非语 音,其中语音可懂度的度量基于语音频道的电平和一个或多个其他频 道的电平。

6.如权利要求5所述的方法,其中,语音可懂度的度量还基于 其中再现被处理的音频的收听环境中的噪声电平。

7.如权利要求3所述的方法,其中,一个或多个参数的调整响 应于娱乐音频的一个或多个长期描述符。

8.如权利要求7所述的方法,其中,长期描述符是娱乐音频的 平均对话电平。

9.如权利要求7所述的方法,其中,长期描述符是对已应用于 娱乐音频的处理的估计。

10.如权利要求3所述的方法,其中,一个或多个参数的调整是 根据处方公式的,所述处方公式使一个听者或一组听者的听敏度与所 述一个或多个参数相关联。

11.如权利要求3所述的方法,其中,一个或多个参数的调整是 根据一个或多个听者的偏好的。

12.如权利要求1所述的方法,其中,所述处理提供动态范围控 制、动态均衡、谱锐化、语音提取、降噪、或其他语音增强机制。

13.如权利要求12所述的方法,其中,通过动态范围压缩/扩展 功能提供动态范围控制。

14.一种适于执行如权利要求1所述的方法的设备。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200880009929.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top