[发明专利]噪声降低方法和装置有效
| 申请号: | 201380012027.6 | 申请日: | 2013-02-08 |
| 公开(公告)号: | CN104205214B | 公开(公告)日: | 2016-11-23 |
| 发明(设计)人: | 市川治;S·J·伦尼 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G10L21/0264 | 分类号: | G10L21/0264;G10L15/20;G10L21/0216 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
| 地址: | 美国纽*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 噪声 降低 方法 装置 | ||
1.一种噪声降低方法,所述方法包括:
基于观测语音的频谱而生成针对每个频带的置信度指数的步骤;
生成概率模型的步骤,所述概率模型被表示为具有针对每个频带的维度的混合多维度正态分布,每个正态分布被表示为第一正态分布和第二正态分布的乘积;以及
通过在所述概率模型上执行MMSE估计来估计失配向量估计值、以及基于所述失配向量估计值来获得干净语音估计值的步骤,
其中所述第一正态分布是基于所述观测语音而生成的失配向量的概率分布,并且
其中所述第二正态分布具有零的均值和如下的方差,所述方差被定义为随着所述置信度指数变得更大而输出更小的值的函数。
2.一种噪声降低方法,所述方法包括:
基于观测语音的频谱而生成针对每个频带的置信度指数的步骤;
生成概率模型的步骤,所述概率模型被表示为具有针对每个频带的维度的混合多维度正态分布,每个正态分布被表示为第一正态分布和第二正态分布的乘积;以及
通过在所述概率模型上执行MMSE估计来获得干净语音估计值的步骤,
其中所述第一正态分布是基于所述观测语音而生成的干净语音的概率分布,并且
其中所述第二正态分布具有以观测值作为均值并且具有如下的方差,所述方差被定义为随着所述置信度指数变得更大而输出更小的值的函数。
3.根据权利要求1或2所述的方法,其中所述置信度指数是表示所述观测语音的谐波结构的显著性的指数。
4.根据权利要求1至3中的任一项所述的方法,其中生成置信度指数的所述步骤包括:
从所述观测语音的所述频谱提取谐波结构并且归一化所述谐波结构的步骤;
在梅尔刻度上平滑经归一化的值的步骤;以及
将经平滑的所述值归一化为从0到1的步骤。
5.一种计算机可执行的程序产品,用于使得计算机执行根据权利要求1至4中的任一项所述的方法的步骤。
6.一种噪声降低装置,所述装置包括:
置信度指数生成单元,被配置为基于观测语音的频谱而生成针对每个频带的置信度指数;以及
噪声降低单元,被配置为生成概率模型,所述概率模型被表示为具有针对每个频带的维度的混合多维度正态分布,每个正态分布被表示为第一正态分布和第二正态分布的乘积,被配置为通过在所述概率模型上执行MMSE估计来估计失配向量估计值,以及被配置为基于所述失配向量估计值来获得干净语音估计值,
其中所述第一正态分布是基于所述观测语音而生成的失配向量的概率分布,并且
其中所述第二正态分布具有零的均值和如下的方差,所述方差被定义为随着所述置信度指数变得更大而输出更小的值的函数。
7.一种噪声降低装置,所述装置包括:
置信度指数生成单元,被配置为基于观测语音的频谱而生成针对每个频带的置信度指数;以及
噪声降低单元,被配置为生成概率模型,所述概率模型被表示为具有针对每个频带的维度的混合多维度正态分布,每个正态分布被表示为第一正态分布和第二正态分布的乘积,以及被配置为通过在所述概率模型上执行MMSE估计来获得干净语音估计值,
其中所述第一正态分布是基于所述观测语音而生成的干净语音的概率分布,并且
其中所述第二正态分布具有以观测值作为均值并且具有如下的方差,所述方差被定义为随着所述置信度指数变得更大而输出更小的值的函数。
8.根据权利要求6或7所述的噪声降低装置,其中所述置信度指数是表示所述观测语音的谐波结构的显著性的指数。
9.根据权利要求6至8中的任一项所述的装置,其中所述置信度指数生成单元包括:
用于从所述观测语音的所述频谱提取谐波结构并且归一化所述谐波结构的装置;
用于在梅尔刻度上平滑经归一化的值的装置;以及
用于将经平滑的所述值归一化为从0到1的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380012027.6/1.html,转载请声明来源钻瓜专利网。





