[发明专利]语音降噪算法在审
申请号: | 201810274913.0 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108428456A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 禹深义;娄进凯;张勤磊;胥杨;李万顺;高峻峰;丁辉;付琰;于江菊 | 申请(专利权)人: | 浙江凯池电子科技有限公司 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0232 |
代理公司: | 郑州金成知识产权事务所(普通合伙) 41121 | 代理人: | 郭增欣 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音降噪算法:使用仿真软件采集声音样本,并进行A/D转换;将经过AD采样后的带噪语音进行短时傅里叶变换,并对每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,利用先验信噪比结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,根据纯净语音能量谱与当前帧数据的相位谱,进行短时傅里叶反变换并合成,形成连续的纯净语音信号。本发明利用多种端点监测算法结合噪声进行估计,进而提高噪声估计的准确度。 | ||
搜索关键词: | 能量谱 信噪比 帧数据 语音 先验 降噪算法 噪声估计 谱估计 短时傅里叶变换 纯净语音信号 傅里叶反变换 前一帧数据 纯净信号 纯净语音 端点监测 仿真软件 频率分量 声音样本 算法结合 算法模型 准确度 相位谱 有效帧 门限 噪声 合成 采集 检测 | ||
【主权项】:
1.一种语音降噪算法,包括以下步骤:(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;![]()
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;(5)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:ξi(k)≈αξi‑1(k)+(1‑α)(γi(k)‑1)其中α为平滑因子,一般取0.9‑1.0,这里取0.95,ξi‑1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;(6)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
其中ξi(k)为当前帧数据频率分量k的先验信噪比,
为当前帧数据后验信噪比的维纳估计,Yi(k)为当前帧数据频率分量k的带噪语音的能量谱,Xk为当前帧数据频率分量k的纯净语音的能量谱;(7)根据计算出的纯净语音能量谱与计算出的当前帧数据的相位谱,进行短时傅里叶反变换,将信号从频域转换到时域,再对每一帧数据进行合成,形成连续的纯净语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江凯池电子科技有限公司,未经浙江凯池电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810274913.0/,转载请声明来源钻瓜专利网。
- 上一篇:声纹特征的采集方法及系统
- 下一篇:音频去重方法及装置