[发明专利]一种基于改进YOLOv5的卫星图像小目标检测方法在审
申请号: | 202111567696.2 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114220015A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 王俊;庞磊;周焕来;陈璐;刘博文;余梦鹏;张诗涵;朱敬伦;贾海涛 | 申请(专利权)人: | 一拓通信集团股份有限公司 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/40;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210000 江苏省南京市江苏省自贸*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov5 卫星 图像 目标 检测 方法 | ||
本发明公开了一种基于改进YOLOv5的卫星图像小目标检测方法。该发明在小目标检测方向上具有一定的通用性,该专利以遥感影像小目标检测为说明案例。为解决遥感图像目标检测中对小目标误检、漏检及特征提取能力不足等问题,提出基于改进YOLOv5的小目标检测算法。算法使用Mosaic‑6方法进行数据增强,通过将主干网络替换为特征提取能力更强的Swin Transformer结构,调整损失函数,有利于网络捕获全局信息和丰富的上下文信息;通过修改网络颈部结构,即在特征金字塔和路径聚合网络中引入CBAM注意力模块,有利于网络对中间特征图自适应细化特征,进一步提升网络模型对小目标的检测效果。将改进后的算法应用在密集小目标情景下的遥感图像检测中,实验结果表明,相较于原始YOLOv5算法,该算法在小目标检测上具有更强的特征提取能力和更高的检测精确度。
技术领域
本发明涉及深度学习中的目标检测领域,针对小目标检测特别是遥感影像目标检测技术。
背景技术
在遥感领域中,卫星图像的分辨率一般比较大,其中存在着大量的小目标物体。由于这些目标相对于整幅图像来说,尺寸较小、分辨率较低,使得在实现快速检测识别目标时,很难准确检测到存在的小目标。随着深度学习技术的不断成熟,用于遥感影像的目标检测方法越来越多。由于图像中存在众多的目标物体,想要从其中检测并定位出小目标是非常具有挑战性的,实现过程中会存在大量误检和漏检,从而影响到整体的检测效果。因此,研究遥感影像中的小目标检测技术是人工智能发展领域中的热点之一。
为了能够准确的检测出遥感图像中存在的弱小目标,常用的检测方法有:Haar分类器;梯度定向直方图和支持向量机方法(HOG+SVM);可变形部分模型技术(DPM);基于深度神经网络的方法。Haar分类器将AdaBoost算法训练出来的强分类器进行级联,并且在底层的特征提取中采用了高效率的矩形特征和积分图方法,但是由于原始特征中含有较少的上下文信息,无法提取更多高频特征并有效识别出待检目标。梯度直方图特征(HOG)是一种对图像局部重叠区域的密集型描述符,它通过计算局部区域的梯度方向直方图来构成特征,使用梯度直方图特征结合SVM分类器来对目标进行检测,但是梯度直方图的方法存在描述子生成过程冗长,较难处理密集型目标等问题,并且有对噪声数据相当敏感等缺点。可变形部分模型(DPM)方法可以看作是梯度直方图和SVM分类器的升级版,但是DPM结构相对复杂,检测速度也比较慢,同时无法对复杂场景下的目标表现出良好的检测效果。
随着深度学习的不断进步和快速发展,其在遥感图像领域的应用越来越广泛,尤其是在目标检测领域,出现了YOLO、RCNN、SSD等优秀的目标检测框架,但对于小目标检测,始终是目标检测领域的一个难题。本发明就是着力于解决遥感影像中存在大量小目标造成的难题。本发明在小目标检测领域具有一定的通用性,并针对图像中存在小目标的问题而改进了数据增强模块,使得网络能够学习提取到更多微小细节。
发明内容
为了克服上述现有技术的不足,本发明提出了一种基于改进的YOLOv5小目标检测技术。该技术应用了深度学习中的高性能通用的目标检测模型YOLOv5,并针对遥感图像中存在的小目标以及分布数量众多等问题(如附图1所示)对YOLOv5算法作了进一步的改进。
本发明所采用的技术方案是:
步骤1:输入图像进入网络,第一进行锚框的自适应计算、第二进行图片的自适应缩放,第三实现Mosaic-6数据增强;
步骤2:特征提取主干网络采用Swin-Transformer结构,包括第一Focus切片操作,第一下采样层,第二卷积归一化层,第二下采样层,第三卷积归一化层,第三下采样层,第四卷积归一化层,第四下采样层,第五卷积归一化层,第五下采样层;
步骤3:步骤2中第三至第五下采样层产生的特征图都采用1x1的卷积进行特征提取,得到的特征图分别记为M3,M4,M5;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于一拓通信集团股份有限公司,未经一拓通信集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111567696.2/2.html,转载请声明来源钻瓜专利网。