[发明专利]基于改进YOLO V5的无人机航拍图像目标检测方法有效
| 申请号: | 202111155472.0 | 申请日: | 2021-09-29 |
| 公开(公告)号: | CN113807464B | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 程向红;曹毅;胡彦钟;张文卓;钱荣辉 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06V10/764;G06V10/774 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 许小莉 |
| 地址: | 210096 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 改进 yolo v5 无人机 航拍 图像 目标 检测 方法 | ||
本发明公开一种基于改进YOLO V5的无人机航拍图像目标检测方法,属于深度学习和目标检测领域。该方法首先利用无人机航拍图像构建相关数据集,然后在YOLO V5主干网络部分利用卷积层替换Focus模块中的切片层,接着利用Neck部分对图像特征进一步处理,然后针对无人机高空航拍视角带来的目标杂散分布且目标占像素比过小问题,在网络预测层部分优化剔除76×76×255的大检测头,并同时调整锚框,最后通过泛化交并比、平均精度以及推理速度评价目标检测性能。该方法在提高识别准确率和特征提取性能的基础之上,能够实现对无人机航拍图像目标的快速、准确检测。
技术领域
本发明涉及一种基于改进YOLO V5的无人机航拍图像目标检测方法,属于深度学习和目标检测技术领域。
背景技术
无人机影像的智能化感知不仅可以高效地提取地物信息,还能拓展无人机的场景理解能力,为无人机自主探测和飞行提供技术支持。目标检测是提升无人机影像智能感知的关键技术之一,但无人机航拍图像一般存在背景复杂、目标分布密集、尺度小、同一类别目标的角度差异大等特征。传统的“基于手动特征提取+分类器”的目标检测算法己无法满足复杂环境和多尺度下的检测精度要求。随着深度学习在解决图像处理上表现出的高效实用性,利用深度学习实现航拍图像深度变化特征的提取可有效避免传统方法的缺陷。
当前,随着深度神经网络的发展,目标检测领域的研究基本上分为两个方向,一个是基于候选区域的双阶段目标检测算法,如Faster-RCNN;另外一个是基于回归计算的单阶段目标检测方法,如YOLO V5。基于候选区域的双阶段的目标检测算法虽然精度很高,但是检测效率不高。而单阶段目标检测方法如2020年提出的YOLO V5,其在VOC 2007/2012数据集上可达到推理时间0.007秒。与Faster-RCNN相比,YOLO V5的推理速度提高了3倍,且具有更高的精度。
针对无人机航拍特殊环境,基于YOLO V5的目标检测方法面临如下两个难题。第一,无人机高空俯拍目标属于小目标,其占像素比例小,检测难度大;第二,无人机载荷小,电源供能有限,需通过提高网络推理速度,来提高其单次飞行作业效率。因此,在提高原有精度的前提下,改进YOLO V5主干网络架构,轻量化其网络模型,并提高其推理速度,对于YOLO V5应用到无人机航拍图像目标检测领域具有重要意义。
发明内容
本发明的目的是针对YOLO V5应用到无人机航拍图像目标检测中存在的因检测目标聚集为小目标,导致检测难度大,和主干网络复杂,导致实时性不够的问题,提出一种基于改进YOLO V5的无人机航拍目标检测方法,其可在提高原有YOLO V5精度的前提下,改进YOLO V5主干网络架构,轻量化其网络模型,提高其推理速度,实现快速、准确的无人机航拍目标检测。
上述的目的通过以下技术方案实现:
一种基于改进YOLO V5的无人机航拍目标检测方法,该方法包括如下步骤:
(1)利用无人机航拍图像构建数据集:对无人机航拍图像进行分类和标注后,得到带有类别标签的图像数据集,将带有类别标签的图像数据集划分为训练集和测试集,其中80%作为训练集,20%作为测试集;
(2)对步骤(1)得到的带有类别标签的图像数据集,进行预处理操作得到特征图,并将预处理后的特征图输入到改进的YOLO V5网络获取不同尺度的无人机航拍图像特征图;改进的YOLO V5网络是指在主干网络部分利用卷积层替换Focus模块中的切片层,并依次分别串联卷积层模块、跨阶段局部网络、空间金字塔池化模块;
(3)对步骤(2)得到的不同尺度的无人机航拍图像特征图,将其输入到改进的YOLOV5网络中的Neck部分,Neck部分对不同尺度的无人机航拍图像特征图进行上采样和特征融合后获得不同尺度的张量数据;
(4)对步骤(3)得到的不同尺度的张量数据,将其输入到改进的YOLO V5网络中的预测层部分,在预测层部分优化剔除大检测头与自适应调整锚框,最终计算得到无人机航拍目标的检测框;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111155472.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种眼影盒注塑模具及其制造方法
- 下一篇:一种带茶叶复火烘焙功能的电茶炉





