[发明专利]一种语音增强方法、装置、设备及存储介质在审
申请号: | 202110961480.8 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113658600A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 周振昆 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/18;G10L21/0208 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张影 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 增强 方法 装置 设备 存储 介质 | ||
本申请提出一种语音增强方法、装置、设备及存储介质,该方法包括:将带噪语音输入预先训练的复合式对抗增强网络模型,得到所述复合式对抗增强网络模型输出的语音增强结果,所述语音增强结果中至少包括增强语音;其中,所述复合式对抗增强网络模型对带噪语音进行语音增强处理得到的增强语音的声纹特征,接近于与带噪语音对应的干净语音的声纹特征。上述方法可以在对带噪语音进行语音增强的同时,降低语音增强造成的语音失真。
技术领域
本申请涉及语音增强技术领域,具体涉及一种语音增强方法、装置、设备及存储介质。
背景技术
语音增强是指干净语音在现实生活中受到来自各种噪声干扰时,需要通过一定的方法将噪声滤除,以提升语音的质量和可懂度的技术。
对于说话人语音来说,其主要能量集中于低频范围(0Hz-1500Hz),高频部分(大于1500Hz)包含的能量相对较少。尽管说话人语音中的高频部分能量较低,但是却包含了说话人音色、音调等重要的声纹信息。相对能量较高的低频部分,能量较低的高频内容更容易被噪声淹没。
常规的语音增强方案,通常是基于信号处理的语音增强方法和基于深度学习的语音增强算法,这些方法对高信噪比的语音信号进行增强的效果较好,但是对于低信噪比的语音信号,这些方法在对噪声进行去除时,会将语音信号的高频部分连同噪声一起去除,从而使语音信号丢失重要的声纹信息,造成听感上的语音失真。
发明内容
基于上述技术现状,本申请提出一种语音增强方法、装置、设备及存储介质,可以在对带噪语音进行语音增强的同时,降低语音增强造成的语音失真。
为了达到上述目的,本申请提出具体技术方案:
一种语音增强方法,包括:
将带噪语音输入预先训练的复合式对抗增强网络模型,得到所述复合式对抗增强网络模型输出的语音增强结果,所述语音增强结果中至少包括增强语音;
其中,所述复合式对抗增强网络模型对带噪语音进行语音增强处理得到的增强语音的声纹特征,接近于与带噪语音对应的干净语音的声纹特征。
可选的,所述语音增强结果中还包括音频增益,所述音频增益基于对带噪语音进行语音增强处理得到的增强语音与带噪语音在各采样点的幅度比值而确定;
所述复合式对抗增强网络模型对带噪语音进行语音增强处理得到的音频增益,接近于带噪语音对应的干净语音相对于该带噪语音的音频增益;
所述方法还包括:
根据所述语音增强结果,获取与输入的所述带噪语音对应的增强语音。
可选的,所述根据所述语音增强结果,获取与输入的所述带噪语音对应的增强语音,包括:
根据所述语音增强结果中的增强语音以及音频增益,计算得到与输入的所述带噪语音对应的增强语音。
可选的,所述复合式对抗增强网络模型,包括至少两个深度对抗增强模块,各个深度对抗增强模块依次串联连接,每个深度对抗增强模块分别用于进行语音增强处理,并且输出语音增强处理得到的增强语音。
可选的,所述复合式对抗增强网络包括依次串联的第一深度对抗增强模块、第二深度对抗增强模块和第三深度对抗增强模块;
其中,输入所述复合式对抗增强网络模型的带噪语音输入所述第一深度对抗增强模块,所述第三深度对抗增强模块的输出作为所述复合式对抗增强网络模型输出的语音增强结果;并且,所述第一深度对抗增强模块的输出语音的信噪比和输入语音的信噪比之间的差值,与所述第二深度对抗增强模块的输出语音的信噪比和输入语音的信噪比之间的差值相同。
可选的,所述第一深度对抗增强模块、所述第二深度对抗增强模块和所述第三深度对抗增强模块分别包括设定数量的多尺度残差单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110961480.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电话银行导航方法、装置、电子设备及存储介质
- 下一篇:一种阻尼水性树脂