[发明专利]一种基于改进YOLOv5的SAR图像飞机目标检测方法在审
| 申请号: | 202310553214.0 | 申请日: | 2023-05-16 |
| 公开(公告)号: | CN116630798A | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 张涛;黄柏澄;张增辉;郁文贤 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/762;G06V10/774;G06V10/80;G06V10/82;G06V10/766;G06N3/0464;G06N3/08 |
| 代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 改进 yolov5 sar 图像 飞机 目标 检测 方法 | ||
1.一种基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,对目标检测算法YOLOv5进行改进,获得改进后的目标检测算法YOLOv5,包括以下步骤:
步骤1、在输入层中采用Mosaic数据增强方式,对输入图像进行预处理,采用K均值聚类算法针对飞机目标尺寸优化锚框;
步骤2、所述步骤1的特征图输入改进的主干网络,改进的主干网络是指在主干网络中引入坐标注意力机制CA,采用SPD-CA卷积块替换主干网络对图像进行下采样所采用的跨步卷积;
步骤3、所述步骤2得到的不同尺度的图像特征图输入到改进的YOLOv5网络中的Neck部分,采用设计的FFP特征融合金字塔网络结构改进目标检测算法YOLOv5的Neck结构,实现自适应特征融合;
步骤4、所述步骤3得到不同尺度的张量数据,输入到改进的YOLOv5网络中的预测层部分,在预测层之前添加全局注意力机制GAM,捕捉全局信息,减少不准确的目标定位。
2.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,所述步骤1,所述Mosaic数据增强方式采用图片随机缩放、随机裁剪、随机排布的方式进行拼接,对输入图像进行预处理,提升小目标的检测效果。
3.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,所述步骤1,采用K-means聚类算法针对数据集中飞机目标尺寸优化锚框,通过对数据进行聚类分析提升先验框和目标框的匹配度,进行自适应锚框计算,对每个检测头都更换所有初始锚框大小。
4.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,所述步骤2,在YOLOv5模型的主干网络部分将下采样所用的3*3卷积核且步数为2的卷积块替换为设计的SPD-CA卷积块,完全替代卷积步长和池化层;SPD层是一个由空间到深度的连接层,具体操作是在图像中每隔一个像素提取出一个值,类似于邻近下采样,将特征图分为四张子特征图,具体表示如下:
f0,0=X[0:S:2,0:S:2],f1,0=X[1:S:2,0:S:2],
f0,1=X[0:S:2,1:S:2],f1,1=X[1:S:2,1:S:2]
S为图像尺寸size,之后沿着通道维度将这些子特征映射连接在一起,在对特征映射进行下采样的同时,保留了通道维度的所有信息,避免了信息的非歧视丢失;在SPD层后引入坐标注意力机制层CA,加强对目标点的注意,感受飞机目标的位置信息,最后添加一层单步长卷积层去改变使用学习参数的通道数量。
5.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,所述步骤3,从主干网络的后端将所述步骤2得到的图像特征图输入到改进的YOLOv5网络中的Neck部分,Neck结构由原来的PANet简单双向特征金字塔结构变为设计的FFP特征融合金字塔结构;Neck在特征金字塔网络的基础上引入自下而上的路径增强结构,细化主干网络输出的图像特征矩阵实现双向特征金字塔,并吸收BiFPN与ASFF两种结构的思想,在主干网络与自下而上特征融合路径之间增加跳跃连接分支,即处在同一层次的输入节点与输出节点之间添加一条额外的边,使其能在同层次之间融合更多的特征;同时,在双向特征传输的路径当中加入ASFF特征融合结构,实现不同层次之间特征的交叉融合。
6.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,所述步骤4,不同尺度的特征图数据输入到改进的YOLOv5网络中的预测层部分,在Neck部分后端即预测层之前集成一种全局注意力机制,使得模型结合不同尺度下的目标特征,保留特征融合之后的目标特征信息。
7.如权利要求1所述的基于改进YOLOv5的SAR图像飞机目标检测方法,其特征在于,还包括以下步骤:基于获取到的SAR图像飞机目标数据集,得到带有标签的图像数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310553214.0/1.html,转载请声明来源钻瓜专利网。





