[发明专利]基于卷积循环网络和WPE算法的语音增强混合处理方法在审

专利信息
申请号: 202110607848.0 申请日: 2021-06-01
公开(公告)号: CN115424627A 公开(公告)日: 2022-12-02
发明(设计)人: 侯仲舒;卢晶 申请(专利权)人: 南京大学
主分类号: G10L21/02 分类号: G10L21/02;G10L21/0216;G10L25/27;G10L25/30
代理公司: 江苏法德东恒律师事务所 32305 代理人: 李媛媛
地址: 210046 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 卷积 循环 网络 wpe 算法 语音 增强 混合 处理 方法
【说明书】:

发明公开了一种基于卷积循环网络和WPE算法的语音增强混合处理方法。该方法的步骤为:(1)使用清晰语音数据集、噪声数据集以及房间冲激响应数据集合成模拟含噪混响语音;(2)对模拟含噪混响语音和对应的清晰语音分别做短时傅里叶变换得到两者的短时傅里叶谱;(3)使用短时傅里叶谱训练DPCARN‑WPE模型权重;(4)对待增强的含噪混响语音做短时傅里叶变换得到短时傅里叶谱;(5)将含噪混响语音短时傅里叶谱输入完成训练的模型,得到增强语音的短时傅里叶谱;(6)对增强语音的短时傅里叶谱进行逆短时傅里叶变换。本发明能够在强混响、低信噪比、非稳态噪声等多种复杂噪声场景下对语音进行增强,鲁棒性较高。

技术领域

本发明属于语音增强的领域,主要针对低信噪比、非稳态噪声、强混响情景下的语音增强任务。

背景技术

在人类日常生活环境中采集语音过程往往存在以下干扰——背景噪声、混响声:背景噪声来源于说话人环境中的干扰声源,对于声能量随时间变化幅度较小的背景噪声,如空调机、洗衣机发出的声音等,它们被称为稳态噪声。而如音乐播放器的歌声、街道上突然响起的喇叭声等声能量随时间变化较为剧烈的噪声,则称为非稳态噪声。在语音信号处理中常用信噪比来衡量任意时刻目标语音与噪声能量的比值,而噪声是否稳态、信噪比高或低往往就对应着不同的噪声抑制策略。混响来源于声源辐射的声波经环境中物体表面,如墙面、天花板等,反射后再次被传声器接收,常用混响时间(声压级下降60dB所需时间)来衡量环境的混响程度。在语音中保留早期混响对人的听感是有益的,而晚期混响则可能会造成音质的损失,因此构建出有效消除晚期混响的模型是十分必要的。上述干扰都可能会造成语音的失真,严重影响语音的清晰度、可懂性,给听者带来不良好的听感体验,也会给进一步的语音处理,如自动语音识别、情感分析等,带来更大的困难,而这些技术在目前的人工智能领域都有重要的应用,与人们的日常生活日益密切。因此提取含噪混响语音中清晰语音成分的语音增强技术是研究者们的重要课题。

谱减法可以用来实现噪声抑制。该方法基于最小均方误差(Minimum Mean-Squared Error,MMSE)估计噪声功率谱(GERKMANN T,HENDRIKS R C.Unbiased MMSE-BasedNoise Power Estimation With Low Complexity and Low Tracking Delay[J].IEEETransactions on Audio SpeechLanguage Processing,2012,20(4):1383–1393),随后将含噪语音功率谱减去噪声功率谱得到增强语音的功率谱,再结合含噪语音短时傅里叶谱的相位信息得到增强语音短时傅里叶谱,再经逆傅里叶变换得到增强语音信号。谱减法在许多场景下取得了良好的噪声抑制效果,但由于其假设的噪声和语音模型的限制,该算法在处理某些低信噪比、非稳态噪声场景语音的效果较差,容易导致语音的失真。

WPE算法被用于语音的去混响(NAKATANI T,YOSHIOKA T,KINOSHITA K,etal.Speech Dereverberation Based on Variance-Normalized Delayed LinearPrediction[J].IEEE Transactions on Audio SpeechLanguage Processing,2010,18(7):1717–1731)。它对语音短时傅里叶谱建立时帧的自回归模型,通过迭代的方式估计逆滤波器系数和早期混响的功率谱,进而求得清晰语音的短时傅里叶谱。WPE算法在语音去混响上取得了优越的效果,但算法的迭代特性使其难以运用在短延时的实时处理当中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110607848.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top