[发明专利]基于注意力机制和特征交叉融合的目标检测方法及系统在审

申请号：	202210532337.1	申请日：	2022-05-11
公开（公告）号：	CN115035361A	公开（公告）日：	2022-09-09
发明（设计）人：	李松斌;阳祥芝;刘鹏	申请（专利权）人：	中国科学院声学研究所南海研究站
主分类号：	G06V10/774	分类号：	G06V10/774;G06V10/44;G06V10/80;G06V10/82;G06N3/04;G06N3/08
代理公司：	北京方安思达知识产权代理有限公司 11472	代理人：	杨青;王蔚
地址：	570105 海***	国省代码：	海南;46
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于注意力机制特征交叉融合目标检测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于注意力机制及特征交叉融合的目标检测方法及系统，该系统包括骨干网、颈层、特征交叉融合模块和检测头。具体地：首先，通过骨干网对输入图像提取多层次特征。然后，颈层采用特征金字塔网络(FPN)和路径融合网络(PAN)，分别自顶向下和自底向上地对不同层次的特征进行融合。特征金字塔网络自顶向下传达强语义特征，而路径融合网络自底向上传达强定位特征。此外，在特征融合过程中，引入注意力机制，从通道维度以及空间维度全方位地学习更丰富的语义信息和细节信息。紧接着，通过特征交叉融合模块，将高层次特征与低层次特征交叉融合，进一步提高特征之间的信息利用率。最后，将融合的特征送至检测头，预测目标类别及目标所在位置。

技术领域

本发明涉及计算机视觉及深度学习技术领域，特别涉及一种基于注意力机制及特征交叉融合的目标检测方法及系统。

背景技术

目标检测作为当前计算机视觉领域的研究热点之一，主要任务是找出图像中感兴趣的目标，并确定目标的类别和位置。

传统目标检测方法大概分为区域选择(滑动窗)、特征提取(SIFT、HOG等)、分类器(SVM、Adaboost等)三部分。即首先在给定图像上选择候选区域，然后提取这些区域的特征，最后使用训练的分类器进行分类。传统目标检测存在两个主要问题：一是基于滑动窗口的区域选择策略没有针对性，时间复杂度高，窗口冗余；另一方面是手工设计的特征鲁棒性较差，没法适应多样性的变化。

近年来，深度学习席卷了语音、图像、视觉等各大领域，传统方法遇到的瓶颈也随着深度学习方法的引入而被打破。深度神经网络具有强大的表达能力和数据拟合能力，能够自动提取并学习图像中的关键信息，具有很强的鲁棒性和信息综合能力，能够适应多样性的变化。

现有基于图像的目标检测主要集中在对陆地上的目标进行检测，如：室内环境中的人脸检测、行李安检，室外道路检测、车辆检测、行人检测等等，而很少有针对海上目标的检测，但他们本质上都有相同之处，都是通过深度学习模型提取特征直接预测目标类别及其位置，因此，海上目标检测可以借鉴现有其他目标检测任务的方法。事实上，海上目标检测意义重大。设计一个海面目标监测系统，不仅可以实时的监控过往船只的航行安全，保障航行及运输安全，而且可以跟踪并判断目标船只(如敌船、海盗船)的意图，便于及时制定对策，对海防事业也有很大帮助。

目前，我国主要通过对卫星遥感图像、红外图像和雷达图像进行分析、处理，实现海上目标检测。但这些方法在实际应用中，容易受到海上复杂天气、光照变化等因素的影响，存在监测距离短、监控范围小、清晰度低、夜视能力差等问题，极大地影响着检测精度和定位效果。

发明内容

本发明的目的在于克服现有海上目标检测方法的技术缺陷，提出了一种基于注意力机制和特征交叉融合的海上目标检测方法及系统，该方法能够进行像素级别的目标检测，实现对目标的定位，提高目标检测率，降低误检率，也更适用于复杂情况下的海上目标检测。

为了实现上述目的，本发明提出了一种基于注意力机制及特征交叉融合的目标检测方法，所述方法首先基于对经过预处理的训练集图片提取特征，并对提取的特征分别通过特征金字塔网络、路径融合网络以及特征交叉融合模块进行交叉提炼，并在提炼时引入多种注意力机制，由此得到输出特征后，将输出特征送入检测头得到预测结果，计算预测结果与真实标签之间的损失，根据计算的损失反复训练调整模型参数，直至得到最优模型参数后输出目标检测网络模型，然后将待检测图片输入网络模型得到预测结果，最后，对预测结果进行解码得到待检测图片中目标的位置、类别及其置信度。多种注意力机制指的是Transformer结构和CBAM(Convolutional Block Attention Module，卷积注意力模块)。Transformer结构本身也包含注意力机制，而CBAM包含通道注意和空间注意两种注意力。

作为上述技术方案的改进之一，所述方法在建立目标检测网络模型时包括以下步骤：

步骤1)数据预处理，将训练所需图片进行缩放增强后按每组B张随机分成M组；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所南海研究站，未经中国科学院声学研究所南海研究站许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210532337.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种CoNi合金MOF多孔材料及其制备和应用
下一篇：一种深度学习模型的云边协同训练和部署系统及方法

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于注意力机制和特征交叉融合的目标检测方法及系统在审

专利文献下载