[发明专利]共振峰依赖的语音信号增强有效
申请号: | 201280076334.6 | 申请日: | 2012-09-04 |
公开(公告)号: | CN104704560B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | M·克里尼;I·沙尔克-舒普;M·布克 | 申请(专利权)人: | 纽昂斯通讯公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李光颖;王英 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音共振峰 语音信号处理 语音信号分量 语音信号增强 麦克风信号 输入麦克风 动态调节 密度区域 信号应用 噪声分量 增益因子 短期谱 高能量 共振峰 频域 检测 | ||
1.一种计算机实施的方法,所述方法采用至少一个硬件实施的计算机处理器以用于语音信号处理,所述方法包括:
接收具有语音信号分量和噪声分量的输入麦克风信号;
将所述麦克风信号变换到短期谱信号的频域集中;
基于检测所述谱信号中的高能量密度区域来估计在所述谱信号之内的语音共振峰分量;
对所述谱信号应用一个或多个动态调节的增益因子,以只在浊音语音音素期间和具有阈值以上的信噪比的所述语音共振峰分量上增强所述语音共振峰分量;
基于所述语音共振峰分量的估计的假定可靠性来调节所述语音共振峰分量的中心频率周围的所述增益因子,包括调节所述增益因子以相对于较低可靠性共振峰估计,对较高可靠性共振峰估计,使所述语音共振峰分量提升得更多;并且
要求所述语音共振峰分量的语音共振峰分量之间的最小间隙。
2.根据权利要求1所述的方法,其中,基于使用线性预测编码滤波器寻找谱峰来估计所述语音共振峰分量。
3.根据权利要求1所述的方法,其中,基于使用多个不同的平滑常数对所述谱信号进行无限脉冲响应平滑来估计所述语音共振峰分量。
4.根据权利要求1所述的方法,其中,所述增益因子是基于被集中在对应于所述语音共振峰分量的频率区域的成形窗口的。
5.根据权利要求4所述的方法,其中,根据与所述语音信号分量相关联的对应音素来动态地调节所述成形窗口。
6.根据权利要求4所述的方法,其中,根据所述麦克风信号的信噪比来动态地调节所述成形窗口。
7.根据权利要求1所述的方法,其中,应用所述增益因子以过低估计所述噪声分量,以便减少所述谱信号的共振峰区域中的语音失真。
8.根据权利要求1所述的方法,还包括:
将所述增益因子与一个或多个噪声抑制系数进行组合,以提高宽带信噪比。
9.根据权利要求1所述的方法,还包括:
将共振峰增强的谱信号输出到移动电话应用程序和语音识别应用程序中的至少一个。
10.一种语音信号处理系统,包括:
语音信号输入部,用于接收具有语音信号分量和噪声分量的麦克风信号;
信号预处理器,用于将所述麦克风信号变换到短期谱信号的频域集中;
共振峰估计模块,用于基于检测所述谱信号中的高能量密度区域来估计在所述谱信号之内的语音共振峰分量;以及
共振峰增强模块,用于对所述谱信号应用一个或多个动态调节的增益因子以只在浊音语音音素期间和具有阈值以上的信噪比的所述语音共振峰分量上增强所述语音共振峰分量,并用于基于所述语音共振峰分量的估计的假定可靠性来调节所述语音共振峰分量的中心频率周围的所述增益因子,其中,调节所述增益因子以相对于较低可靠性共振峰估计,对较高可靠性共振峰估计,使所述语音共振峰分量提升得更多,并且其中所述语音共振峰分量的语音共振峰分量之间存在最小间隙。
11.根据权利要求10所述的系统,其中,所述共振峰估计模块基于在线性预测编码滤波器中寻找谱峰来估计所述语音共振峰分量。
12.根据权利要求10所述的系统,其中,所述共振峰估计模块基于使用多个不同的平滑常数对所述谱信号进行无限脉冲响应平滑来估计所述语音共振峰分量。
13.根据权利要求10所述的系统,其中,所述增益因子是基于被集中在对应于所述语音共振峰分量的频率区域的成形窗口的。
14.根据权利要求13所述的系统,其中,所述共振峰增强模块根据与所述语音信号分量相关联的对应音素来动态地调节所述成形窗口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽昂斯通讯公司,未经纽昂斯通讯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280076334.6/1.html,转载请声明来源钻瓜专利网。