[发明专利]基于WSHRRPCA算法的语音增强方法有效
申请号: | 201911290388.2 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111145768B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 罗勇江;杨腾飞;杨家利;毕鲁浩;汤建龙;王钟慧 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L21/0216;G10L21/0224;G10L21/0232 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 侯琼;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 wshrrpca 算法 语音 增强 方法 | ||
本发明公开了一种基于WSHRRPCA算法的语音增强方法,主要解决有色噪声环境下现有算法语音增强效果差问题,具体为:利用含噪语音样本建立白化模型,在时域使用该模型对含噪语音进行白化处理后用短时傅里叶变换获取其时频幅度谱和时频相位谱;通过哈希函数映射法将时频幅度谱每一列中的谱元素排列顺序进行打乱重排,再用鲁棒主成分分析算法将其分解得到增强时频幅度谱并恢复排列顺序;利用增强时频幅度谱和时频相位谱组成增强时频谱,重构出完整的时域白化增强语音信号,使用白化模型对该信号进行逆白化处理得到增强语音。本发明能够有效消除含噪语音中的多种噪声,达到语音增强的目的,可应用于语音接收系统、语音编码系统和语音识别系统。
技术领域
本发明属于信号处理技术领域,进一步涉及语音信号的处理,具体为一种基于 白化短时傅里叶谱哈希重排鲁棒主成分分析WSHRRPCA (Whitened-short-time-Fourier-spectrogram-hash-rearranged Robust Principal Component Analysis)算法的语音增强方法,可用于语音接收系统及语音识别系统, 在语音接收系统中实现语音增强与降噪,在语音识别系统的前端预处理部分中提高 输入信号的信噪比,从而提升系统抗干扰能力和识别率。
背景技术
语音增强技术涉及的应用领域十分广泛,包括语音通话、电话会议、场景录音、 军事窃听、助听器设备和语音识别设备等,且许多语音编码和语音识别系统的预处 理模块均涉及到该项技术。传统的语音增强算法主要分为三大类:谱减法、基于统 计模型的算法和子空间算法。然而,这些传统的语音增强算法在应用时都有其局限 性。谱减法常常以噪声谱的估计为基础进行信号增强处理,当出现某些非平稳噪声 时,会导致噪声谱估计不准确,影响信号增强效果,而且该算法容易产生“无中生有” 的音乐噪声;基于统计模型的算法一般需要假设语音信号和噪声信号是统计独立的 且服从高斯分布;子空间算法则需要假设干净的语音信号子空间和噪声子空间是正 交的,但这种子空间正交的假设在实际情况中是非常不合理的。为了突破传统算法 的限制,人们开始寻找新的理论。近年来,基于凸优化的压缩传感及由其衍生的矩 阵秩最小化和低秩矩阵恢复理论成为数字信号处理领域的研究热点之一,而作为低 秩矩阵恢复理论中的一种矩阵低秩稀疏分解算法——鲁棒主成分分析,也已经被应 用于语音增强领域,且取得了较好的效果。然而,基于鲁棒主成分分析的语音增强 方法具有以下缺点:第一,该方法在白噪声环境中具有不错的性能,但有色噪声和 白噪声的能量分布特征有所不同的,这使得此方法在消除有色噪声时,性能不足;第二,在消除噪声时,也会将一部分的低秩语音成分去除,造成语音成分的丢失, 影响了语音增强的效果。
C.Sun等人在其发表的论文“A novel speech enhancement method based onconstrained low-rank and sparse matrix decomposition”(Speech Communication,60: 44-55,2014)中提出了一种基于具有低秩和稀疏约束的矩阵分解算法的语音增强方法。该方法的实施步骤为:第一步,使用短时傅里叶变换获取含噪语音的时频幅度 谱与时频相位谱,并利用三点中值滤波器对该时频幅度谱进行平滑处理;第二步, 利用约束低秩和稀疏矩阵分解算法对含噪语音的时频幅度谱进行分解,获取低秩矩 阵和稀疏矩阵,并对该稀疏矩阵进行二进制时频掩蔽处理;第三步,利用稀疏矩阵 和含噪语音相位谱重构增强语音时频谱,并使用逆短时傅里叶变换重构出时域形式 的增强语音。该方法的主要问题是,仅仅通过限制低秩矩阵秩的大小来降低低秩语 音成分被错误消除的可能性,未从根本上解决该问题,因此,仍然有部分低秩语音 被当做噪声而去除。同时,该方法对稀疏矩阵的稀疏度增加了限制,使得在强背景 噪声情况下,语音成分被大量消除,降低了语音质量。
发明内容
本发明目的在于针对上述现有技术的不足,提出一种基于白化短时傅里叶谱哈希重排鲁棒主成分分析算法的语音增强方法,在噪声环境中获取高质量增强语音, 主要应用于语音接收系统、语音编码系统及语音识别系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911290388.2/2.html,转载请声明来源钻瓜专利网。