[发明专利]基于麦克风阵列的多目标神经网络语音处理方法及装置在审
申请号: | 202210451728.0 | 申请日: | 2022-04-24 |
公开(公告)号: | CN114708880A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 李志;李霄;丘四海;王欢良;张李 | 申请(专利权)人: | 苏州奇梦者科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0224;G10L21/0232;G10L25/30;G10L25/21 |
代理公司: | 苏州国诚专利代理有限公司 32293 | 代理人: | 陈君名 |
地址: | 215024 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 麦克风 阵列 多目标 神经网络 语音 处理 方法 装置 | ||
本发明公开了一种基于麦克风阵列的多目标神经网络语音处理方法及装置,该方法将多通道录音数据和多通道回采数据输入RLS滤波器进行多通道线性回声消除,再采用滤波器的误差信号和估计回声信号的频域相关度来计算每个频点的残余回声能量;将误差信号和估计的残余回声信号声学特征输入残差神经网络,且多目标递进,使残差神经网络能够在较小的网络结构中快速的收敛;后置的降噪、去回声、去混响算法使用多通道维纳滤波器配合mask统一计算,这样复杂度低,且避免了单个算法依次处理过程中的语音损失。从而实现了让语音降噪、去回声、去混响的目标融合在一起,具有计算复杂度低,延时低实时性好,且语音质量高的特点,符合实际的使用需求。
技术领域
本发明涉及语音信号处理技术,尤其涉及一种基于麦克风阵列的多目标神经网络语音处理方法及装置。
背景技术
基于麦克风阵列的语音降噪、去回声、去混响,也就是对声音的加工修饰,被广泛应用于会议,教育,娱乐等各种领域,目前怎样获取到清晰易懂的语音信号已经成为会议通信场景中重中之重。
目前语音降噪、去回声、去混响的技术大体分三类:一是利用麦克风阵列获取的多通道语音相关性、延时等信息,基于语音信号的理论建模,配合统计优化相关理论,计算信号最优解。实际使用中语音信号随着场景的变化而变化,语音呈现较为复杂的变化情况,用假设的理论模型很难得到一个好的处理效果;二是通过神经网络进行端到端训练,直接计算语音的最佳波形,这种方法网络结构较为复杂,实际使用中计算量过大,且需要大量语音训练数据。此外,该方法受语音数据的质量和场景匹配度的限制较大,处理效果不够稳定,且延时较大,不能满足实时通信的要求;三是通过神经网络和信号模型相配合,把部分需要调试的参数交给神经网络去训练,然而这种方法没有将降噪、去回声、去混响融合到一起,往往需要分开优化,而降噪、去回声、去混响的目标存在一定的冲突,所以很难在实际应用场景中获得很好的效果,同时网络结构也较复杂,实际使用中计算量大,且延时也较大,不能满足实时通信的要求。
发明内容
本发明的目的在于提供一种能够获得最佳语音音质效果、计算复杂度低并能够满足实时通信要求的基于麦克风阵列的多目标神经网络语音处理方法及装置。
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
根据本发明的一方面,提供了一种基于麦克风阵列的多目标神经网络语音处理方法,包括:
步骤100、使用短时傅立叶变换获取多通道录音的频域数据和多路立体声回采的频域数据;
步骤200、将多通道录音的频域数据与多路立体声回采的频域数据送入RLS滤波器中得到误差信号和估计信号,计算二者的频域相关度,通过特定学习率平滑历史帧的频域相关度,再乘以误差信号得到估计的各频点的残余回声信号能量;
步骤300、将误差信号和残余回声信号的BFCC特征输入多目标神经网络,获取融合的降噪、去回声、去混响的语音能量掩码;
步骤400、通过波束形成器滤波后反变换到时域,得到干净的处理后的时域音频。
在一实施例中,所述步骤200中,对RLS线性滤波的输出为;
Lsty(n,f)=WH(n-1,f)X(n,f);
E(n,f)=Y(n,f)-Lsty(n,f);
W(n,f)=W(n-1,f)+k(n,f)EH(n,f);
k(n,f)=P(n-1,f)X(n,f)/(1+XH(n,f)P(n-1,f)X(n,f));
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州奇梦者科技有限公司,未经苏州奇梦者科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210451728.0/2.html,转载请声明来源钻瓜专利网。