[发明专利]降噪方法、装置、电子设备及计算机可读存储介质在审
| 申请号: | 202210416607.2 | 申请日: | 2022-04-20 |
| 公开(公告)号: | CN114898765A | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 陈林毅;毕永建 | 申请(专利权)人: | 厦门亿联网络技术股份有限公司 |
| 主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L19/02;G10L19/10;G10L25/18;G10L25/24;G10L25/27;H04N7/15 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 贾耀斌 |
| 地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请实施例提供了一种降噪方法、装置、电子设备及计算机可读存储介质,其中方法包括:根据语音能量分布特征获取干净语音训练集;对干净语音训练集进行卷积房间冲激响应,得到模拟混响语音;将模拟混响语音进行加噪处理,得到模拟带噪语音;通过降噪模型对模拟带噪语音的归一化幅度谱进行计算,得到掩码数据,对掩码数据进行压缩处理,得到压缩掩码;根据预设压缩参数对压缩掩码进行解压处理,得到解压掩码;根据解压掩码对真实带噪语音进行降噪处理,得到预测干净语音。这样,可以提高视频会议的语音降噪效果。
技术领域
本申请涉及视频技术领域,尤其涉及一种降噪方法、装置、电子设备及计算机可读存储介质。
背景技术
随着视频技术不断发展,人们对会议视频设备的通话音质也越来越高,视频会议过程中出现的噪声,特别是突发噪声会严重影响用户视频会议的体验。目前使用神经网络模型消除突发噪声在学术界已经成为主流,现有的消除突发噪声的方案主要通过使用一段干净语音作为标签,叠加噪声后作为神经网络模型的输入数据,然后直接对神经网络模型进行训练,此种方案的语音环境与真实视频会议环境相差较大,导致应用到真实的视频会议中进行降噪时的降噪效果比较差。
发明内容
为了解决上述技术问题,本申请实施例提供了一种降噪方法、装置、电子设备及计算机可读存储介质。
第一方面,本申请实施例提供了一种降噪方法,所述方法包括:
根据语音能量分布特征获取干净语音训练集;
对所述干净语音训练集进行卷积房间冲激响应,得到模拟混响语音;
将所述模拟混响语音进行加噪处理,得到模拟带噪语音;
通过降噪模型对所述模拟带噪语音的归一化幅度谱进行计算,得到掩码数据,对所述掩码数据进行压缩处理,得到压缩掩码;
根据预设压缩参数对所述压缩掩码进行解压处理,得到解压掩码;
根据所述解压掩码对真实带噪语音进行降噪处理,得到预测干净语音。
第二方面,本申请实施例提供了一种降噪装置,所述装置包括:
获取模块,用于根据语音能量分布特征获取干净语音训练集;
冲激模块,用于对所述干净语音训练集进行卷积房间冲激响应,得到模拟混响语音;
加噪模块,用于将所述模拟混响语音进行加噪处理,得到模拟带噪语音;
计算模块,用于通过降噪模型对所述模拟带噪语音的归一化幅度谱进行计算,得到掩码数据,对所述掩码数据进行压缩处理,得到压缩掩码;
解压模块,用于根据预设压缩参数对所述压缩掩码进行解压处理,得到解压掩码;
降噪模块,用于根据所述解压掩码对真实带噪语音进行降噪处理,得到预测干净语音。
第三方面,本申请实施例提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述计算机程序在所述处理器运行时执行第一方面提供的降噪方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序在处理器上运行时执行第一方面提供的降噪方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门亿联网络技术股份有限公司,未经厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210416607.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种EPS塑料泡沫成型机
- 下一篇:一种可快速止血的止血材料及制备方法





