[发明专利]一种基于深度神经网络和卷积神经网络的双耳声源定位方法和系统有效
申请号: | 201910808413.5 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110517705B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 刘宏;庞程;丁润伟;吴璐璐;孙永恒 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/51;G01S5/20 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度神经网络和卷积神经网络的双耳声源定位方法和系统,首先对双耳声音信号提取双耳能量差和互相关函数;接着将提取的双耳能量差和互相关函数输入训练完成的级联神经网络,在深度神经网络分支中判别声音源的方向,在卷积神经网络中提取声音源前后向区分的细节信息,得出声音源在机器人头部前半平面或后半平面的信息;最后,综合深度神经网络和卷积神经网络的输出结果,得出最终的定位结果。本发明能够在一定程度上抵抗噪声和混响的干扰,完成声源前后向及角度的判别问题,实现全向声源定位。 | ||
搜索关键词: | 一种 基于 深度 神经网络 卷积 声源 定位 方法 系统 | ||
【主权项】:
1.一种基于深度神经网络和卷积神经网络的双耳声源定位方法,其特征在于,包括以下步骤:/n1)对双耳声音信号提取双耳能量差和互相关函数;/n2)将提取的双耳能量差和互相关函数输入结合深度神经网络和卷积神经网络的双耳声源定位网络,通过深度神经网络输出预测的声源的转向角类别,通过卷积神经网络输出预测的声源的前后向类别;/n3)根据双耳声源定位网络中深度神经网络和卷积神经网络的输出结果进行整合判断,得到双耳声源定位结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910808413.5/,转载请声明来源钻瓜专利网。