[发明专利]用于自动语音识别(ASR)的自适应的基于相位差的噪声消减有效

专利信息
申请号: 201380078945.9 申请日: 2013-09-17
公开(公告)号: CN105474312B 公开(公告)日: 2019-08-27
发明(设计)人: L·库里洛;G·斯特摩尔 申请(专利权)人: 英特尔公司
主分类号: G10L21/0272 分类号: G10L21/0272;G10L21/0232;H04R3/00;G10L21/0216
代理公司: 上海专利商标事务所有限公司 31100 代理人: 黄嵩泉
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 自动 语音 识别 asr 自适应 基于 相位差 噪声 消减
【说明书】:

本文总体描述了用于使基于相位差的降噪系统自适应的系统和方法的实施例。在一些实施例中,确定与第一和第二音频信号相关联的空间信息,其中,第一和第二音频信号包括波束内部的目标音频和来自波束外部的噪声。估计与音频信号相关联的信噪比(SNR)。使相位差到增益因子的映射自适应以便确定用于衰减与波束外部的噪声相关联的频率元的衰减因子。执行频谱相减,以便基于较少地影响与目标信号相关联的频率的权重来从单信道信号中去除估计的噪声。应用依赖于频率的衰减因子以衰减波束外部的频率元,从而产生具有减小的噪声的目标信号。

背景技术

在诸如语音识别以及自动电话会议之类的各种应用中,语音信号可能遭噪声污染,所述噪声可包括高斯噪声、语音噪声(不相关的对话)和混响。已知用于识别音频信号中说出的单词的自动语音识别(ASR)系统。ASR技术使配备了话筒的计算设备能够解释语音,并且由此提供人到计算机的输入设备(诸如,键盘或小键盘)的替代方案。

ASR的准确性在噪声条件下降级。例如,如果在用户向机器说话时在背景中具有在播放的收音机或在说话的人,则自动语音识别器的输出包含比在无声的背景的情况下导出的输出多得多的误差。在此类环境中,由于信噪比可能是不足够的,因此语音识别是困难的。此外,环境的噪声模型是未知的,并且它会取决于环境条件(例如,风、音乐、竞争的背景对话等)而变化。

噪声消减算法通过在音频信号被传递到语音识别器之前处理此音频信号来提高噪声环境中的ASR精度。已提出了许多不同的噪声消减算法。用于语音增强的一种算法基于话筒阵列的信道之间的相位差。然而,需要针对特定的应用来调谐此方法,并且此方法仅对有限范围的噪声水平和类型作用良好。

相应地,当在诸如智能电话或膝上型计算机之类的移动设备中采用语音识别器时,语音增强必须克服高度变化的声环境。同时,对每一种噪声条件手动调节噪声消减算法是不切实际的。

附图说明

图1示出根据实施例的自适应的基于相位差的降噪系统;

图2a-b是示出根据实施例的、从对于500Hz和1000Hz的固定TDoA产生的相位差的频率依赖关系的曲线;

图3示出根据实施例的、用于多于两个的话筒的基于相位的空间滤波;

图4示出根据实施例的、使用对波束方向的动态调整的、用于两个话筒的基于相位的空间滤波;以及

图5示出根据实施例的、用于使基于相位差的降噪系统自适应的示例机器的框图。

具体实施方式

用于自动语音识别(ASR)系统的噪声消减算法的实施例执行对当前的背景噪声水平自适应的基于相位差的噪声消减。通过使用来自多个话筒的空间信息来估计信噪比(SNR)并使用此SNR来噪声消减滤波器的相位差对增益因子的映射自适应,从而改善高度变化的噪声条件和水平下的性能。也可以使用对相位差的依赖于频率的缩放以及单信道频谱相减来改善用于ASR的噪声消减算法的实施例。

图1示出了根据实施例的自适应的基于相位差的降噪系统100。在图1中,具有至少两个话筒的话筒阵列的信号流和处理序列包括根据实施例的、用于处理多个块的块A-B110,140以及用于扩展/修改的块C 150。

由信道1 116和信道2 118表示的话筒112、114两者记录包括语音和噪声两者的信号。噪声可能例如由在背景中谈话的第二人或来自墙的反射导致。由于话筒112,114位于不同的位置处,因此话筒112,114中的每一个都在略微不同的时刻接收对应于不同的源的信号,这对应于每一个源与每一个话筒112,114之间的不同的距离。例如,对于话筒112,114之间的通常使用的例如7cm的间隔以及来自以相对于连接话筒112,114的线呈0°或180°的角度的单个源的信号,到达时间差(TDoA)可以是约0.0002秒或0.2ms、或在16kHz的采样速率下的3个样本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201380078945.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top