[发明专利]降噪方法和装置有效
申请号: | 201310071302.3 | 申请日: | 2013-03-06 |
公开(公告)号: | CN103310798A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 市川治 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L15/20 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法 装置 | ||
技术领域
本发明涉及语音识别技术,并且更具体地涉及降噪技术。
背景技术
在语音识别技术中,去除背景噪声的效果是对改进话语识别精度的重要问题。当背景噪声相对较小时,相关领域的滤波技术(例如谱减法和Wiener滤波)具有成效,但是对较大的背景噪声无法获得理想的结果,因为目标语音被淹没在噪声中。
为此,近几年已注意使用纯语音(例如无任何噪声叠加的话语语音)的概率模型的方法。已经报告这些基于模型的降噪的方法显示了甚至对大背景噪声的高性能。为此,日本专利申请公开号.2008-298844(专利文献1)公开了一种采用基于模型的降噪的语音识别系统。
[引用列表]
[专利文献]
[专利文献1]日本专利申请公开号2008-298844
发明内容
[技术问题]
本发明的目的是提供一种应用于语音识别前端的降噪新技术。
[问题的解决方案]
发明者已经努力地检查了应用于语音识别前端的降噪的方法,并且因此,设想了一种配置,其中代表观测语音的谐波结构的显著性的置信指标给定为每个频带的输出的权重,从而实现了本发明。
换言之,根据本发明提供了第一方法,它是一种降噪的方法,包括:基于观测语音的谱生成每个频带的置信指标的步骤;以及通过对基于观测语音生成的纯语音的概率模型执行MMSE估计以及对于每个频带使用该置信指标作为权重对MMSE估计的后验概率进行加权来估计纯语音的估计值的步骤。
而且,根据本发明提供了第二方法,它是一种降噪方法,包括:基于观测语音的谱生成每个频带的置信指标的步骤;从观测语音估计纯语音估计值的步骤;以及通过针对每个频带以置信指标用作为权重在所述观测语音的观测值和纯语音估计值之间执行线性插值而得到输出值的步骤。
此外,根据本发明,提供组合上述第一方法和第二方法的第三方法,用于使计算机执行每个所述方法的计算机程序产品,以及实现用于实现每个所述方法的功能的降噪装置。
[发明的有益效果]
如上所述,根据本发明,通过给出代表观测语音的谐波结构的显著性的置信指标作为每个频带的输出的权重,优化前端的输出。
附图说明
图1所示为相关领域的语音识别系统中前端的配置的示意图。
图2所示为从观测语音的频谱生成梅尔(mel)LPW的步骤的示意图。
图3所示为从梅尔LPW生成置信指标α的步骤的示意图。
图4所示为第一实施方式的语音识别系统中前端的配置的示意图。
图5所示为第一实施方式的前端执行的过程的流程图。
图6所示为从梅尔LPW生成置信指标β的步骤的示意图。
图7所示为第二实施方式的语音识别系统中前端的配置的示意图。
图8所示为第二实施方式的前端执行的过程的流程图。
图9所示为第三实施方式的语音识别系统中前端的配置的示意图。
图10所示为第三实施方式的前端执行的过程的流程图。
具体实施方式
此后,将参考图中所示的实施方式说明本发明。但是,本发明不限于图中所示的实施方式。注意,在下列要参考的图中,对共同的元件给出相同的标号,且其说明被适当省略。
一般而言,一种语音识别系统包括前端和后端,前端将某种转换应用于话语语音的声学信号以提取特征量,后端基于前端提取的特征量查找数据库以指定话语的内容。本发明是对迄今为止已应用于前端的降噪的改进,并且旨在通过对观测语音的每个频带利用置信来优化所述前端的输出。
此后,将基于三个实施方式来描述本发明。第一实施方式公开了一种改进基于模型的噪声补偿中使用的MMSE(最小均方误差)的估计的技术。第二实施方式公开了一种通过在纯语音的估计值和观测值之间实现线性插值优化输出值的技术。此外,第三实施方式公开了一种组合上述两种技术的技术。
<基于模型的噪声补偿>
在开始描述本发明的实施方式之前,将基于图1描述应用于前端的基于模型的噪声补偿。注意,在下文描述中,“观测语音”是指其中背景噪声叠加在话语语音上的实际观测到的声音;“纯语音”是指没有任何噪声叠加的话语语音;“纯语音估计值”是指从观测语音估计出的纯语音的估计值。而且,“频谱”是指功率谱或幅度谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310071302.3/2.html,转载请声明来源钻瓜专利网。