[发明专利]一种基于联合优化网络的目标声源定位方法及系统有效
申请号: | 202111149182.5 | 申请日: | 2021-09-29 |
公开(公告)号: | CN113589230B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 刘忆森;周松斌;万智勇 | 申请(专利权)人: | 广东省科学院智能制造研究所 |
主分类号: | G01S5/22 | 分类号: | G01S5/22;G06N20/00 |
代理公司: | 广州容大知识产权代理事务所(普通合伙) 44326 | 代理人: | 刘新年 |
地址: | 510070 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联合 优化 网络 目标 声源 定位 方法 系统 | ||
本发明提供了一种基于联合优化网络的目标声源定位方法及系统。该方案包括通过在监测位置放置的麦克风阵列采集所有的目标声源信号,获取声音数据集;将声音数据集划分为训练集和验证集;对训练集进行预处理后,送入预设的目标声检测和定位联合网络,获取目标声源定位模型;将验证集进行预处理后,送入目标声源定位模型,计算目标声检测模块对于训练集和验证集的余弦相似度,并确定目标声源检测阈值;实施获取声音数据,利用余弦相似度和目标声源检测阈值确定目标声源的方位预测。该方案通过基于联合优化网络的目标声源定位,只需采集包含目标声源的高信噪比声音信号进行训练建模,可同时进行目标声源检测和端到端系统定位。
技术领域
本发明涉及声源定位技术领域,更具体地,涉及一种基于联合优化网络的目标声源定位方法及系统。
背景技术
目标声源检测定位可以根据拾音系统接收到的声源信号进行目标检测以及定位跟踪,因此在交通鸣笛监控、音视频监控和盲视觉导航系统中都有很多的应用。
在本发明技术之前,传统声源定位包括2种:第一种是算法波束形成方法,因此该声源定位算法无法针对目标声进行定位,且定位算法在环境混响复杂和声源多的场景下不能够准确定位;第二种是基于机器学习算法的声源目标检测定位方法,该方法将系统分成声源检测子任务和声源定位子任务,存在模型训练时训练数据无法穷举非目标声源场景,系统非端到端的问题。
发明内容
鉴于上述问题,本发明提出了一种基于联合优化网络的目标声源定位方法及系统,其可以实现通过基于联合优化网络的目标声源定位,只需采集包含目标声源的高信噪比声音信号进行训练建模,可同时进行目标声源检测和端到端系统定位。
根据本发明实施例第一方面,提供一种基于联合优化网络的目标声源定位方法。
在一个或多个实施例中,优选地,所述一种基于联合优化网络的目标声源定位方法包括:
通过在监测位置放置的麦克风阵列采集所有的目标声源信号,并将所述目标声源信号按照坐标标签和声音数据一起存储到声音数据集;
将所述声音数据集划分为训练集和验证集;
对所述训练集进行预处理后,送入预设的目标声检测和定位联合网络,获取目标声源定位模型,其中,所述目标声检测和定位联合网络包括时序特征提取模块、目标声检测模块和声源坐标回归预测模块;
将所述验证集进行预处理后,送入所述目标声源定位模型,计算所述目标声检测模块对于所述训练集和所述验证集的余弦相似度,并确定目标声源检测阈值;
实时获取声音数据,利用所述余弦相似度和所述目标声源检测阈值确定目标声源的方位预测。
在一个或多个实施例中,优选地,所述通过在监测位置放置的麦克风阵列采集所有的目标声源信号,并将所述目标声源信号按照坐标标签和声音数据一起存储到声音数据集,具体包括:
以所述麦克风阵列为原点,建立直角坐标系;
将所述监测位置划分为至少一个监测区域位置子块;
获取所有的监测区域位置子块中心坐标;
根据所述监测区域位置子块中心坐标计算麦克风阵列方位角;
采集所有的监测区域位置子块的声源信号,存储为初始声源信号;
对所述初始声源信号以预设的固定时间间隔进行保存;
获取预设的采样频率;
利用第一计算公式获取数据长度;
将所述数据长度的对应的所述初始声源信号存储为所述声音数据集;
所述第一计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省科学院智能制造研究所,未经广东省科学院智能制造研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111149182.5/2.html,转载请声明来源钻瓜专利网。