[发明专利]语音降噪算法在审
申请号: | 201810274913.0 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108428456A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 禹深义;娄进凯;张勤磊;胥杨;李万顺;高峻峰;丁辉;付琰;于江菊 | 申请(专利权)人: | 浙江凯池电子科技有限公司 |
主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0232 |
代理公司: | 郑州金成知识产权事务所(普通合伙) 41121 | 代理人: | 郭增欣 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 能量谱 信噪比 帧数据 语音 先验 降噪算法 噪声估计 谱估计 短时傅里叶变换 纯净语音信号 傅里叶反变换 前一帧数据 纯净信号 纯净语音 端点监测 仿真软件 频率分量 声音样本 算法结合 算法模型 准确度 相位谱 有效帧 门限 噪声 合成 采集 检测 | ||
1.一种语音降噪算法,包括以下步骤:
(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;
(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;
(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;
(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;
(5)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;
(6)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
其中ξi(k)为当前帧数据频率分量k的先验信噪比,为当前帧数据后验信噪比的维纳估计,Yi(k)为当前帧数据频率分量k的带噪语音的能量谱,Xk为当前帧数据频率分量k的纯净语音的能量谱;
(7)根据计算出的纯净语音能量谱与计算出的当前帧数据的相位谱,进行短时傅里叶反变换,将信号从频域转换到时域,再对每一帧数据进行合成,形成连续的纯净语音信号。
2.根据权利要求1所述的语音降噪算法,其特征是:步骤(3)中的VAD检测,使用能熵比进行检测,具体能熵比计算过程如下所示:
(1)计算当前帧数据的每个频率分量的归一化谱概率密度函数,如下式所示:
其中Yi(k)为第k条谱线频率分量fk的能量谱,为所有频率分量的能量和,pi(k)为第i帧第k个频率分量fk对应的概率密度,N为短时傅里叶变换的分辨率,这里取N=128;
(2)计算当前帧数据的短时谱熵,如下式所示:
其中Hi为当前帧数据的短时谱熵;
(3)计算当前帧数据的能量,如下式所示:
LEi=log10(1+AMPi/a)
其中Yi2(k)是当前帧数据的能量,AMPi为当前帧数据的能量,LEi是改进的能量关系,a是一个常数,这里取1.5:
(4)计算当前帧数据的能熵比,如下式所示:
其中EEFi就是当前帧数据的能熵比,根据EEFi的值,判断是否为有效语音,如果是,则不更新噪声估计的能量谱,如果不是,这里取EEFi<1.6为无效语音,则更新噪声能量谱λd(k),λd(k)=0.9*λd-1(k)+0.1*Yi2(k)
3.根据权利要求1所述的语音降噪算法,其特征是:在进行语音降噪算法的过程中,选择使用数字信号处理器TMS320VC5509A作为主处理芯片,使用音频编解码器TLV320AIC23B作为AD/DA芯片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江凯池电子科技有限公司,未经浙江凯池电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810274913.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:声纹特征的采集方法及系统
- 下一篇:音频去重方法及装置