[发明专利]音频去噪方法和装置、服务器、存储介质有效
| 申请号: | 202010479635.X | 申请日: | 2020-05-29 |
| 公开(公告)号: | CN111613239B | 公开(公告)日: | 2023-09-05 |
| 发明(设计)人: | 张旭;张晨;董培 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/30;G10L21/0208 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 方法 装置 服务器 存储 介质 | ||
1.一种音频去噪方法,其特征在于,包括:
获取待处理的带噪音频信号,所述带噪音频信号包括瞬态噪声;
获取所述带噪音频信号中当前帧信号的估计幅度数据,所述估计幅度数据用于表征去除所述瞬态噪声后对所述当前帧信号估计所得的幅度;
当所述估计幅度数据小于最小幅度数据时,调整所述估计幅度数据以获得幅度超过所述最小幅度数据的目标幅度数据,所述目标幅度数据用于表征所述带噪音频信号去除瞬态噪声后期望获得的目标音频信号的幅度;所述最小幅度数据用于表征在预设时长内所述带噪音频信号在各个频带上幅度的最小值;
基于所述目标幅度数据获取所述目标音频信号;
调整所述估计幅度数据以获得幅度超过所述最小幅度数据的目标幅度数据,包括:
获取所述当前帧信号的幅度数据;
根据所述最小幅度数据和所述当前帧信号的幅度数据获取幅度比例阈值;
对比幅度比例和所述幅度比例阈值;所述幅度比例由预先训练的神经网络模型根据所述幅度数据获取;
当所述幅度比例大于或等于所述幅度比例阈值时,确定所述估计幅度数据作为所述目标幅度数据;当所述幅度比例小于所述幅度比例阈值时,确定所述最小幅度数据作为所述目标幅度数据。
2.根据权利要求1所述的音频去噪方法,其特征在于,所述幅度比例阈值通过以下公式获取:
其中,β(n,k)表示幅度比例阈值,Magmin(n,k)为时频点(n,k)处当前帧信号对应的最小幅度数据,α为常数系数,Mag(n,k)表示时频点(n,k)处当前帧信号的幅度数据。
3.根据权利要求1所述的音频去噪方法,其特征在于,所述方法还包括:
在所述估计幅度数据大于或者等于所述最小幅度数据时,将所述估计幅度数据作为目标幅度数据。
4.根据权利要求1所述的音频去噪方法,其特征在于,获取所述带噪音频信号中当前帧信号的估计幅度数据,包括:
获取所述当前帧信号的初始幅度数据,所述初始幅度数据包括所述瞬态噪声对应的幅度数据;
将所述当前帧信号的初始幅度数据输入到预先训练的神经网络模型,得到所述神经网络模型输出的当前帧信号的幅度比例,所述幅度比例用于表征带噪音频信号去除所述瞬态噪声前后的幅度数据的比例,且取值小于或等于1;
获取所述当前帧信号的幅度比例和所述初始幅度数据的乘积,将所述乘积作为当前帧信号的估计幅度数据。
5.根据权利要求4所述的音频去噪方法,其特征在于,所述神经网络模型采用以下步骤进行训练,包括:
对原始音频样本及其带噪音频样本进行短时傅里叶变换,分别获取所述原始音频样本在时频域下的第一幅度数据、以及所述带噪音频样本在时频域下的第二幅度数据;
根据所述第一幅度数据和所述第二幅度数据获取初始幅度比例,并调整所述初始幅度比例以获得小于或等于1的目标幅度比例,所述目标幅度比例作为所述神经网络模型对应损失函数的参考值;
将所述目标幅度比例和所述第二幅度数据输入到神经网络模型进行训练,直至所述损失函数根据所述神经网线模型输出的幅度比例和所述目标幅度比例计算的损失值满足设定条件时完成训练,得到预先训练的神经网络模型。
6.根据权利要求1所述的音频去噪方法,其特征在于,基于所述目标幅度数据获取所述目标音频信号,包括:
获取当前帧信号的相位信息;
基于所述目标幅度数据和所述相位信息获取时频域的目标音频信息;
对所述时频域的目标音频信息进行短时反傅里叶变换,获得所述目标音频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010479635.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:硬盘承载组件
- 下一篇:一种气溶胶发生器的雾化装置及气溶胶发生器





