[发明专利]基于声学矢量传感器自适应波束形成和深度神经网络技术的目标语音增强方法在审
申请号: | 201911419999.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111341339A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 石伟;王鹏 | 申请(专利权)人: | 深圳海岸语音技术有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0208;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518055 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 声学 矢量 传感器 自适应 波束 形成 深度 神经 网络技术 目标 语音 增强 方法 | ||
1.基于声学矢量传感器自适应波束形成和深度神经网络技术的目标语音增强方法,其特征在于,所述方法包括以下步骤:
A1:对声学矢量传感器中的各梯度传感器输出数据加窗分帧,进行短时傅里叶变换,分别得到各通道传感器的时频谱数据;
A2:根据所述步骤A1中得到的各通道时频谱数据获得各通道传感器间的相互数据比ISDR,并根据所得的ISDR值求得任意时频点占支配地位的声源到达角度估计;
A3:根据所述步骤A1中所得的各通道时频谱数据和步骤A2中得到的声源到达角估计,计算声源功率谱的空间分布,并利用目标方向的功率谱与空间总功率谱的比率配置高阶空间匹配滤波阶数;
A4:在短时傅里叶变换域,根据所述步骤A2获得目标声源到达角度和各时频点处占支配地位的声源到达角度,以及根据所述步骤A3中获得的所述滤波阶数,计算空间匹配波束形成器的高阶系数,完成高阶空间匹配波束滤波器的设计;
A5:利用所述步骤A4中所得的高阶空间匹配波束滤波器,设计目标方向零陷滤波器,对步骤A1中所得各通道数据滤波后,获得自适应波束形成器权值;
A6:利用步骤A5所得的自适应波束形成器权值,对步骤A1中声学矢量传感器各通道原始数据进行波束形成,得到初步增强的单通道目标语音时频谱;
A7:利用步骤A4中所得的高阶空间匹配波束滤波器对步骤A6中所得的单通道数据进行滤波,再次增强目标语音;
A8:通过训练好的专用深度神经网络,对步骤A7所得的数据进行处理,得到最终增强目标语音时频谱;
A9:对步骤A8所得到的数据进行反傅里叶变换,用叠接相加法重建增强后的目标语音时域信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳海岸语音技术有限公司,未经深圳海岸语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911419999.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板
- 下一篇:一种显示控制方法、显示装置和存储介质