[发明专利]降噪方法、装置、电子设备及计算机可读存储介质在审

申请号：	202210416607.2	申请日：	2022-04-20
公开（公告）号：	CN114898765A	公开（公告）日：	2022-08-12
发明（设计）人：	陈林毅;毕永建	申请（专利权）人：	厦门亿联网络技术股份有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216;G10L19/02;G10L19/10;G10L25/18;G10L25/24;G10L25/27;H04N7/15
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	贾耀斌
地址：	361000 福建省厦门市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	方法装置电子设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种降噪方法、装置、电子设备及计算机可读存储介质，其中方法包括：根据语音能量分布特征获取干净语音训练集；对干净语音训练集进行卷积房间冲激响应，得到模拟混响语音；将模拟混响语音进行加噪处理，得到模拟带噪语音；通过降噪模型对模拟带噪语音的归一化幅度谱进行计算，得到掩码数据，对掩码数据进行压缩处理，得到压缩掩码；根据预设压缩参数对压缩掩码进行解压处理，得到解压掩码；根据解压掩码对真实带噪语音进行降噪处理，得到预测干净语音。这样，可以提高视频会议的语音降噪效果。

技术领域

本申请涉及视频技术领域，尤其涉及一种降噪方法、装置、电子设备及计算机可读存储介质。

背景技术

随着视频技术不断发展，人们对会议视频设备的通话音质也越来越高，视频会议过程中出现的噪声，特别是突发噪声会严重影响用户视频会议的体验。目前使用神经网络模型消除突发噪声在学术界已经成为主流，现有的消除突发噪声的方案主要通过使用一段干净语音作为标签，叠加噪声后作为神经网络模型的输入数据，然后直接对神经网络模型进行训练，此种方案的语音环境与真实视频会议环境相差较大，导致应用到真实的视频会议中进行降噪时的降噪效果比较差。

发明内容

为了解决上述技术问题，本申请实施例提供了一种降噪方法、装置、电子设备及计算机可读存储介质。

第一方面，本申请实施例提供了一种降噪方法，所述方法包括：

根据语音能量分布特征获取干净语音训练集；

对所述干净语音训练集进行卷积房间冲激响应，得到模拟混响语音；

将所述模拟混响语音进行加噪处理，得到模拟带噪语音；

通过降噪模型对所述模拟带噪语音的归一化幅度谱进行计算，得到掩码数据，对所述掩码数据进行压缩处理，得到压缩掩码；

根据预设压缩参数对所述压缩掩码进行解压处理，得到解压掩码；

根据所述解压掩码对真实带噪语音进行降噪处理，得到预测干净语音。

第二方面，本申请实施例提供了一种降噪装置，所述装置包括：

获取模块，用于根据语音能量分布特征获取干净语音训练集；

冲激模块，用于对所述干净语音训练集进行卷积房间冲激响应，得到模拟混响语音；