[发明专利]语音降噪算法在审
申请号: | 201810274913.0 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108428456A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 禹深义;娄进凯;张勤磊;胥杨;李万顺;高峻峰;丁辉;付琰;于江菊 | 申请(专利权)人: | 浙江凯池电子科技有限公司 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0232 |
代理公司: | 郑州金成知识产权事务所(普通合伙) 41121 | 代理人: | 郭增欣 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 能量谱 信噪比 帧数据 语音 先验 降噪算法 噪声估计 谱估计 短时傅里叶变换 纯净语音信号 傅里叶反变换 前一帧数据 纯净信号 纯净语音 端点监测 仿真软件 频率分量 声音样本 算法结合 算法模型 准确度 相位谱 有效帧 门限 噪声 合成 采集 检测 | ||
本发明公开了一种语音降噪算法:使用仿真软件采集声音样本,并进行A/D转换;将经过AD采样后的带噪语音进行短时傅里叶变换,并对每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,利用先验信噪比结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,根据纯净语音能量谱与当前帧数据的相位谱,进行短时傅里叶反变换并合成,形成连续的纯净语音信号。本发明利用多种端点监测算法结合噪声进行估计,进而提高噪声估计的准确度。
技术领域:
本发明涉及一种算法,特别是涉及一种语音降噪算法。
背景技术:
无论身处何处,我们都被噪声所包围,噪声可以是平稳的,即不随时间而改变,如电脑风扇噪声;噪声也可以是非平稳的,比如餐馆里面的北京噪声,很多人说话的同时还夹杂着厨房里传出来的声音,这种餐馆噪声的频域以及时域特征随着周围餐桌上人们的对话以及服务员与顾客交流内容的改变而改变。
发明内容:
本发明所要解决的技术问题是:克服现有技术的不足,提供一种能够提高噪声估计的准确度的语音降噪算法。
本发明为解决技术问题所采取的技术方案是:
一种语音降噪算法,包括以下步骤:
(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;
(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;
(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;
(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;
(1)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;
(2)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江凯池电子科技有限公司,未经浙江凯池电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810274913.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:声纹特征的采集方法及系统
- 下一篇:音频去重方法及装置