[发明专利]一种结合MMSE和谱减法的语音增强方法有效

申请号：	201710978076.5	申请日：	2017-10-18
公开（公告）号：	CN107610712B	公开（公告）日：	2020-07-03
发明（设计）人：	颜钱明;虞安波	申请（专利权）人：	会听声学科技（北京）有限公司
主分类号：	G10L21/02	分类号：	G10L21/02;G10L21/0216;G10L21/0208;G10L25/18
代理公司：	北京超凡志成知识产权代理事务所(普通合伙) 11371	代理人：	郭新娟
地址：	100000 北京市海淀区清***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种结合 mmse 减法语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出了一种结合MMSE和谱减法的语音增强方法。该方法包括：获取语音信号并作预加重与傅立叶变换；估计噪声功率谱；计算先验与后验信噪比，对信号作基于短时谱的MMSE处理；利用改进的谱减法计算增益矩阵和孤立因子；利用孤立因子修正增益矩阵以抑制音乐噪声；反变换得到增强的语音信号。本发明提出的算法能更有效地抑制音乐噪声，显著提高了去噪后的语音信噪比与可懂度。

技术领域

本发明属于语音信号处理技术领域，具体地说是指一种结合MMSE和谱减法的语音增强方法。

背景技术

我们日常接收到的语音信号很难是纯净的，它们都夹杂着或多或少的噪声，噪声可能来自环境、录音设备甚至是说话人自身，因此为改善语音质量，提高语音可懂度，我们需要应用语音增强技术。

语音增强是语音处理的一项重要技术，其目的是从带噪语音中提取尽可能纯净的原始语音。但由于噪声信号都是随机产生的，完全消噪几乎不可能。因此，实际语音增强的目标主要有：提高语音清晰度，改善语音质量；提高语音可懂度，方便听者理解。

在语音增强领域，基本谱减法(SS)是原理简单，计算量小的一种经典方法，它最初由美国学者Steven Boll提出，利用人耳对相位不敏感的特点，用带噪语音相位替代纯净语音，然后用带噪语音的频谱减去噪声频谱，其结果与带噪语音相位结合得到语音增强后的结果。其基本公式为其中是增强语音频谱，Y(ω)是带噪语音谱，是估计的噪声谱。之后有很多人对谱减法作出了改进，目前最流行的谱减法公式为：

容易看出当参数ε＝2，α＝1时，上式即化为传统谱减法。但是无论是传统还是改进的谱减法，增强后的语音都会引入尖锐的音乐噪声，从而影响可懂度和信噪比的提升。如何抑制音乐噪声也是谱减法面临的最大的问题。

相比于谱减法，最小均方误差短时谱幅值估计法(MMSE-STSA)引入的音乐噪声就要小很多，这也是一种基于傅立叶短时谱的语音增强算法。它通过假设语音与噪声服从独立高斯分布，根据估计的后验和先验信噪比来计算纯净语音。MMSE能在一定程度上抑制音乐噪声的原因是它采用了Decision-Directed方法(直接判决法)来估计先验信噪比，起到了平滑作用。但是MMSE也存在着语音增强程度有限的问题，在抑制音乐噪声的同时也限制了其提升语音质量的能力。

发明内容

有鉴于此，本发明提出了一种基于MMSE和谱减法的语音增强方法，综合了二者的优点，在保证语音质量的同时抑制了音乐噪声。

第一方面，本发明实施例提供了一种结合MMSE和谱减法的语音增强方法，包括：获取输入语音，对输入语音做预加重及短时傅立叶变换处理得到语音谱，从中估计初始噪声谱，采用MMSE算法预处理。预处理后的语音用改进的谱减法进一步处理，并引入孤立因子抑制音乐噪声的产生。然后将处理后的频谱反傅立叶变换以及去加重得到最终音频。

所述预加重包括：采用滤波器H(z)＝1-μz^-1对原始语音滤波，提升高频质量，其中z表示作z变换，μ是预加重系数。

所述短时傅立叶变换包括：带噪语音、纯净部分、加性噪声分别用y(t),s(t),n(t)表示，有y(t)＝s(t)+n(t)，假设语音与噪声不相关，对语音分帧加汉明窗，变换到频域后对第k帧第i个点有Y²(k,i)＝S²(k,i)+N²(k,i)，其中Y,S,N表示变换到频域后的带噪语音、纯净部分和加性噪声。

所述估计初始噪声谱包括：利用语音间隙估计噪声功率谱N²(k,i)。静寂帧的起始段采用VAD语音活动检测，将最长的一段判别为噪声的起点作为估计噪声的起点，并返回那段噪声的长度。设静寂段帧数为NIS，则估计噪声谱并且每一次迭代过程中，利用VAD语音活动检测更新此估计值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于会听声学科技（北京）有限公司，未经会听声学科技（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710978076.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种结合MMSE和谱减法的语音增强方法有效

专利文献下载