[发明专利]一种结合MMSE和谱减法的语音增强方法有效
申请号: | 201710978076.5 | 申请日: | 2017-10-18 |
公开(公告)号: | CN107610712B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 颜钱明;虞安波 | 申请(专利权)人: | 会听声学科技(北京)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216;G10L21/0208;G10L25/18 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 郭新娟 |
地址: | 100000 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 mmse 减法 语音 增强 方法 | ||
本发明提出了一种结合MMSE和谱减法的语音增强方法。该方法包括:获取语音信号并作预加重与傅立叶变换;估计噪声功率谱;计算先验与后验信噪比,对信号作基于短时谱的MMSE处理;利用改进的谱减法计算增益矩阵和孤立因子;利用孤立因子修正增益矩阵以抑制音乐噪声;反变换得到增强的语音信号。本发明提出的算法能更有效地抑制音乐噪声,显著提高了去噪后的语音信噪比与可懂度。
技术领域
本发明属于语音信号处理技术领域,具体地说是指一种结合MMSE和谱减法的语音增强方法。
背景技术
我们日常接收到的语音信号很难是纯净的,它们都夹杂着或多或少的噪声,噪声可能来自环境、录音设备甚至是说话人自身,因此为改善语音质量,提高语音可懂度,我们需要应用语音增强技术。
语音增强是语音处理的一项重要技术,其目的是从带噪语音中提取尽可能纯净的原始语音。但由于噪声信号都是随机产生的,完全消噪几乎不可能。因此,实际语音增强的目标主要有:提高语音清晰度,改善语音质量;提高语音可懂度,方便听者理解。
在语音增强领域,基本谱减法(SS)是原理简单,计算量小的一种经典方法,它最初由美国学者Steven Boll提出,利用人耳对相位不敏感的特点,用带噪语音相位替代纯净语音,然后用带噪语音的频谱减去噪声频谱,其结果与带噪语音相位结合得到语音增强后的结果。其基本公式为其中是增强语音频谱,Y(ω)是带噪语音谱,是估计的噪声谱。之后有很多人对谱减法作出了改进,目前最流行的谱减法公式为:
容易看出当参数ε=2,α=1时,上式即化为传统谱减法。但是无论是传统还是改进的谱减法,增强后的语音都会引入尖锐的音乐噪声,从而影响可懂度和信噪比的提升。如何抑制音乐噪声也是谱减法面临的最大的问题。
相比于谱减法,最小均方误差短时谱幅值估计法(MMSE-STSA)引入的音乐噪声就要小很多,这也是一种基于傅立叶短时谱的语音增强算法。它通过假设语音与噪声服从独立高斯分布,根据估计的后验和先验信噪比来计算纯净语音。MMSE能在一定程度上抑制音乐噪声的原因是它采用了Decision-Directed方法(直接判决法)来估计先验信噪比,起到了平滑作用。但是MMSE也存在着语音增强程度有限的问题,在抑制音乐噪声的同时也限制了其提升语音质量的能力。
发明内容
有鉴于此,本发明提出了一种基于MMSE和谱减法的语音增强方法,综合了二者的优点,在保证语音质量的同时抑制了音乐噪声。
第一方面,本发明实施例提供了一种结合MMSE和谱减法的语音增强方法,包括:获取输入语音,对输入语音做预加重及短时傅立叶变换处理得到语音谱,从中估计初始噪声谱,采用MMSE算法预处理。预处理后的语音用改进的谱减法进一步处理,并引入孤立因子抑制音乐噪声的产生。然后将处理后的频谱反傅立叶变换以及去加重得到最终音频。
所述预加重包括:采用滤波器H(z)=1-μz-1对原始语音滤波,提升高频质量,其中z表示作z变换,μ是预加重系数。
所述短时傅立叶变换包括:带噪语音、纯净部分、加性噪声分别用y(t),s(t),n(t)表示,有y(t)=s(t)+n(t),假设语音与噪声不相关,对语音分帧加汉明窗,变换到频域后对第k帧第i个点有Y2(k,i)=S2(k,i)+N2(k,i),其中Y,S,N表示变换到频域后的带噪语音、纯净部分和加性噪声。
所述估计初始噪声谱包括:利用语音间隙估计噪声功率谱N2(k,i)。静寂帧的起始段采用VAD语音活动检测,将最长的一段判别为噪声的起点作为估计噪声的起点,并返回那段噪声的长度。设静寂段帧数为NIS,则估计噪声谱并且每一次迭代过程中,利用VAD语音活动检测更新此估计值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于会听声学科技(北京)有限公司,未经会听声学科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710978076.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声纹识别方法及装置
- 下一篇:基于时延估计的回声消除方法及装置