[发明专利]用于语音降噪的方法、装置、电子设备和计算机可读介质在审
申请号: | 202210490037.1 | 申请日: | 2022-05-07 |
公开(公告)号: | CN114783455A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 张超;魏庆凯 | 申请(专利权)人: | 北京快鱼电子股份公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0264;G10L25/24;G10L25/30;G10L25/48 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 张彩珍 |
地址: | 100093 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语音 方法 装置 电子设备 计算机 可读 介质 | ||
本公开的实施例公开了用于语音降噪的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取目标语音;对目标语音进行预处理,得到目标语音的梅尔谱;将梅尔谱输入至预先训练的特征神经网络,得到梅尔谱的幅度掩膜增益系数;根据幅度掩膜增益系数对梅尔谱进行幅度掩膜,得到降噪梅尔谱;将降噪梅尔谱输入至预先训练的神经网络声码器,得到降噪语音。该实施方式实现了对目标语音更加轻量级的降噪处理并得到了更好的去噪效果。
技术领域
本公开的实施例涉及计算机语音信号处理技术领域,具体涉及一种用于语音降噪的方法、装置、电子设备和计算机可读介质。
背景技术
随着通信技术的日益成熟,语音/视频通话的业务量也在不断提高,且用户使用的终端也呈现多样化,如个人电脑、手机以及拾音器等边缘设备。然而,由于用户所处的环境多种多样,各种背景噪声的出现对于语音通话的质量会产生很大影响,如室内空调风机的声音、敲击键盘的声音,户外车声、鸟鸣声等等。
此外,当用户的通信环境有其他人时,其他人的说话声音也会对语音通话造成干扰。为了听到的语音更加清晰,需要对采集的含噪语音进行降噪处理,滤除背景噪声及其他人的说话声音。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了用于语音降噪的方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题。
第一方面,本公开的一些实施例提供了一种用于语音降噪的方法,该方法包括:获取目标语音;对上述目标语音进行预处理,得到上述目标语音的梅尔谱;将上述梅尔谱输入至预先训练的特征神经网络,得到上述梅尔谱的幅度掩膜增益系数;根据上述幅度掩膜增益系数对上述梅尔谱进行幅度掩膜,得到降噪梅尔谱;将上述降噪梅尔谱输入至预先训练的神经网络声码器,得到降噪语音。
第二方面,本公开的一些实施例提供了一种语音降噪装置,装置包括:获取单元,被配置成获取目标语音;预处理单元,被配置成对上述目标语音进行预处理,得到上述目标语音的梅尔谱;特征单元,被配置成将上述梅尔谱输入至预先训练的特征神经网络,得到上述梅尔谱的幅度掩膜增益系数;幅度掩膜单元,被配置成根据上述幅度掩膜增益系数对上述梅尔谱进行幅度掩膜,得到降噪梅尔谱;生成单元,被配置成将上述降噪梅尔谱输入至预先训练的神经网络声码器,得到降噪语音。
第三方面,本申请实施例提供了一种电子设备,该网络设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的上述各个实施例中的一个实施例具有如下有益效果:获取目标语音,之后通过对上述目标语音进行预处理,得到上述目标语音的梅尔谱,再将梅尔谱输入至预先训练的特征神经网络,得到梅尔谱的幅度掩膜增益系数,然后根据幅度掩膜增益系数对梅尔谱进行幅度掩膜,得到降噪梅尔谱,接着将上述降噪梅尔谱输入至预先训练的神经网络声码器,得到降噪语音,从而通过对目标语音的处理,使得到的降噪语音中消除了背景噪声与其他人声的干扰,实现了对目标语音更加轻量级的降噪处理并得到了更好的去噪效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开一些实施例的语音降噪方法的一个应用场景的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京快鱼电子股份公司,未经北京快鱼电子股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210490037.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:摄像镜头
- 下一篇:一种车辆盲区的检测系统