[发明专利]一种基于单麦克风的瞬态噪声检测与抑制的方法及装置有效
| 申请号: | 202310267550.9 | 申请日: | 2023-03-20 |
| 公开(公告)号: | CN115985337B | 公开(公告)日: | 2023-09-22 |
| 发明(设计)人: | 梁民 | 申请(专利权)人: | 全时云商务服务股份有限公司 |
| 主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0232;G10K11/178 |
| 代理公司: | 北京惟盛达知识产权代理有限公司 11855 | 代理人: | 杨青 |
| 地址: | 100010 北京市东城区青*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 麦克风 瞬态 噪声 检测 抑制 方法 装置 | ||
本发明涉及一种基于单麦克风的瞬态噪声检测与抑制的方法及装置,其方法包括:通过单麦克风接收包含噪声的时域数字语音信号;将包含噪声的时域数字语音信号经短时傅里叶变换器变换为对应的包含噪声的短时频谱;通过稳态噪声抑制器预处理模块对包含噪声的短时频谱进行稳态降噪预处理,得到对应的预处理后的短时频谱;通过瞬态噪声抑制器对预处理后的短时频谱进行增强处理,得到对应的增强短时频谱;以及通过逆短时傅里叶变换器,对增强短时频谱进行转换处理,得到对应的时域增强数字语音信号,以通过时域增强数字语音信号完成稳态和瞬态噪声背景下的语音增强任务。
技术领域
本发明涉及噪声检测与抑制技术领域,具体涉及一种基于单麦克风的瞬态噪声检测与抑制的方法、装置、存储介质、电子设备和计算机程序产品。
背景技术
经查阅大量国内外相关文献可知,瞬态噪声的抑制方法基本上有两类,一类是去除时域中的瞬态噪声分量,而另一类是减少变换域(如小波变换域和频域)中的瞬态噪声分量。Vaseghi 和Rayner提出了一种检测和抑制脉冲瞬态噪声(包括相对短时长的噪声脉冲)的时域处理方法,该方法首先对受瞬态脉冲噪声污染的信号段进行检测,然后使用基于期望源是自回归 (AR) 假设的插值来估计该段源信号来替换所检测到的污染信号段;此后,Godsill和Rayner基于统计模型并使用Gibbs采样器插值技术对上述算法的性能进行了进一步的改进;但这类技术均要求受瞬态脉冲噪声污染的语音信号片段的时长要相对很短,否则将会产生明显可感知的语音信号失真。R. Talmon等学者考虑了重复出现的瞬态噪声干扰抑制问题,并提出了一种基于非局部扩散滤波器的这类瞬态噪声干扰抑制频域方法,该方法的第一阶段是估计瞬态噪声的功率谱密度 (PSD),这一估计是通过这样的处理实现的:首先在时域应用线性预测误差滤波器,对麦克风接收信号进行白化处理以增强瞬态噪声,然后对白化处理后的信号在其短时频谱域应用非局部 (Nonlocal) 邻域扩散滤波器来提取瞬态噪声信号的PSD;该方法的第二阶段是基于I. Cohen和B. Berdugo提出的优化修订对数频谱幅度(Optimally-Modified Log-Spectral Amplitude,OM-LSA) 估计器,利用第一阶段估计的瞬态噪声PSD并结合用传统降噪技术估计的运行环境中伪稳态噪声PSD,来进行降噪处理。
由于非局部邻域扩散滤波器工作的基础是假设瞬态噪声干扰模式会重复出现,因此该技术对单次出现的瞬态噪声无法抑制。为克服上述方法的缺陷,A. Hirszhorn等提出一种瞬态和伪稳态噪声联合抑制的另一种频域方法,他们基于浊音频谱分量与瞬态噪声相比变化缓慢的这一观测事实,通过配置比跟踪伪稳态噪声变化更快的合适参数,把OM-LSA估计器中关于伪稳态噪声功率谱的估计算法,扩展到能够跟踪输入语音信号频谱快速变化的修订版,从而能够有效地估计瞬态噪声的PSD,最后根据瞬态噪声和伪稳态噪声的PSD估计,应用OM-LSA估计器来增强语音。该解决方案对瞬态噪声类型具有鲁棒性、不需要离线或预处理或后处理,并且不依赖于瞬态周期性或重复。而C. Zhang等提出了一种基于语音特性和频谱相干性的无延迟瞬态降噪频域方法,该方法首先通过使用能量归一化方差在每个子带中检测瞬态噪声分量,然后对检测到含有瞬态噪声的子带,应用浊音的谐波特性和语音信号的连续性来进行抑制处理,以减少浊音段中的语音失真,此外,还定义了一个新的频谱相干性来区分清音和瞬态噪声,以避免抑制清音。近年来,随着深度学习技术的发展及其在语音识别领域的成功应用,基于监督学习的语音增强算法开始展现其价值。深度神经网络 (DNN)、卷积神经网络 (CNN)、长短期记忆 (LSTM) 网络、生成对抗网络 (GAN)都是应用于频域来实现语音增强;在充分训练的情况下,这些监督学习模型表现出优于传统增强方法的性能,特别在瞬态噪声抑制方面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于全时云商务服务股份有限公司,未经全时云商务服务股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310267550.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种废弃混凝土收集装置
- 下一篇:一种针对视频面审人像的衣着暴露等级识别方法





