[发明专利]语音降噪算法在审

申请号：	201810274913.0	申请日：	2018-03-29
公开（公告）号：	CN108428456A	公开（公告）日：	2018-08-21
发明（设计）人：	禹深义;娄进凯;张勤磊;胥杨;李万顺;高峻峰;丁辉;付琰;于江菊	申请（专利权）人：	浙江凯池电子科技有限公司
主分类号：	G10L21/0224	分类号：	G10L21/0224;G10L21/0232
代理公司：	郑州金成知识产权事务所(普通合伙) 41121	代理人：	郭增欣
地址：	310012 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	能量谱信噪比帧数据语音先验降噪算法噪声估计谱估计短时傅里叶变换纯净语音信号傅里叶反变换前一帧数据纯净信号纯净语音端点监测仿真软件频率分量声音样本算法结合算法模型准确度相位谱有效帧门限噪声合成采集检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音降噪算法：使用仿真软件采集声音样本，并进行A/D转换；将经过AD采样后的带噪语音进行短时傅里叶变换，并对每一帧信号进行VAD检测，根据VAD门限，得出每一帧信号时有效帧还是无效帧，根据当前帧的带噪语音的能量谱和噪声估计的能量谱，计算当前帧数据每一频率分量的后验信噪比，利用当前帧的后验信噪比结合前一帧数据的谱估计器，计算当前帧的先验信噪比，利用先验信噪比结合logMMSE算法模型，计算出当前帧数据的谱估计器，并计算出纯净信号的能量谱，根据纯净语音能量谱与当前帧数据的相位谱，进行短时傅里叶反变换并合成，形成连续的纯净语音信号。本发明利用多种端点监测算法结合噪声进行估计，进而提高噪声估计的准确度。

技术领域：

本发明涉及一种算法，特别是涉及一种语音降噪算法。

背景技术：

无论身处何处，我们都被噪声所包围，噪声可以是平稳的，即不随时间而改变，如电脑风扇噪声；噪声也可以是非平稳的，比如餐馆里面的北京噪声，很多人说话的同时还夹杂着厨房里传出来的声音，这种餐馆噪声的频域以及时域特征随着周围餐桌上人们的对话以及服务员与顾客交流内容的改变而改变。

发明内容：

本发明所要解决的技术问题是：克服现有技术的不足，提供一种能够提高噪声估计的准确度的语音降噪算法。

本发明为解决技术问题所采取的技术方案是：

一种语音降噪算法，包括以下步骤：

(1)使用仿真软件对声音样本进行前期的采集与处理，并进行A/D转换；

(2)将前级经过AD采样后的一段带噪语音，经过分帧(20ms)加窗后进行短时傅里叶变换，由信号的时域处理转换为信号的频时处理，计算出每一帧信号的短时能量谱和相位谱；

其中x(m)为输入信号，w(m)是分析窗，此处取汉明窗，它在时间上反转并且有n个样本的偏移量，ω为频率变量，N为短时傅里叶变换的分辨率，这里取N＝128,Y_i(k)为第帧数据，第k条谱线频率分量f_k的能量谱；

(3)对经过傅里叶分析处理的每一帧信号进行VAD检测，根据VAD门限，得出每一帧信号时有效帧还是无效帧，如果是无效帧，即不含有效语音的帧，更新噪声估计的能量谱，如果是有效帧，则不动作；

(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱，计算当前帧数据每一频率分量的后验信噪比，如下式所示：

其中Y_i²(k)为当前帧数据的频率分量k的能量值，λ_d(k)为噪声估计能量谱中频率分量k的能量值，γ_i(k)为当前帧数据的k频率分量的后验信噪比；

(1)利用当前帧的后验信噪比结合前一帧数据的谱估计器，计算当前帧的先验信噪比，如下式所示：

ξ_i(k)≈αξ_i-1(k)+(1-α)(γ_i(k)-1)

其中α为平滑因子，一般取0.9-1.0，这里取0.95，ξ_i-1(k)为上一帧数据频率分量k的先验信噪比，γ_i(k)为当前帧数据频率分量k的后验信噪比，ξ_i(k)为当前帧数据频率分量k的先验信噪比；

(2)根据计算出的当前帧的先验信噪比，结合logMMSE算法模型，计算出当前帧数据的谱估计器，并计算出纯净信号的能量谱，如下式所示：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江凯池电子科技有限公司，未经浙江凯池电子科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810274913.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音降噪算法在审

专利文献下载