[发明专利]一种基于通道裁剪的无人机视频小目标检测方法在审
申请号: | 202111567636.0 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114220032A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 贾海涛;邹新雷;周焕来;王云;乔磊崖;陈璐;孙靖哲;王俊 | 申请(专利权)人: | 一拓通信集团股份有限公司 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V20/40;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210000 江苏省南京市江苏省自贸*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通道 裁剪 无人机 视频 目标 检测 方法 | ||
本发明公开了一种基于通道裁剪的无人机视频小目标检测方法。该发明在小目标检测方向上具有一定的通用性,该专利以千米无人机高空检测为说明案例。市区以及郊区中存在大量的小目标。针对小目标问题,在通常目标检测方法中为了减小模型内存占用、节省计算资源,根据目标尺寸特点,对YOLOv4原模型的预测层进行了改进,将三尺度检测模型改进为双尺度检测模型;对双尺度检测模型进行正常训练,然后将其BN层的缩放因子进行稀疏训练,最后通过裁剪一定比例的通道数以再次减小模型内存占用提升检测速度。基于通道裁剪的无人机视频小目标检测方法模型能够快速精准的检测远距离小目标,且对于小目标缺陷和极端长宽比缺陷也能够取得较好的效果。
技术领域
本发明涉及深度学习中的目标检测领域,针对小目标检测尤其是高空无人机视频的检测技术。
背景技术
目标检测已经在车辆检测、人脸检测、自动驾驶、安全系统等领域广泛应用并发挥着重要的作用。
相比于传统检测方法,基于深度学习的检测模型具有检测精度高、速度快等优点。基于深度学习的检测模型有one-stage和two-stage两种:one-stag检测模型主要有YOLO、SSD、SDDS等模型,其核心是基于回归的思想,不需要使用区域候选网络,可以直接经主干网络预测出军事目标类别、位置;以two-stage检测模型为代表的有R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、Mask R-CNN等模型,其基本思想是通过卷积神经网络对图像进行特征提取,然后经过区域候选网络生成候选框,再经过“抠图”和进一步的特征表示,最后就可以通过分类和回归得到军事目标的类别和位置。two-stage系列因其繁琐的检测过程导致检测速度远不能满足实时性的要求。
近年来,目标检测在战场感知中的地位愈加突出。基于无人机平台的目标检测具有视野大、监测范围广等优点,但由于载重、能耗等方面的限制,无人机平台能够搭载的存储和算力是有限的。因此,一般检测模型在无人机上直接部署时会面临模型占用内存大、实时性差的问题。因此,在保证检测精度的前提下有效解决上述问题,能够有效提升无人机侦察的检测速度,有助于战场指挥员或机载系统及时全面分析战场形势,做出更合理的决策。
YOLO作为one-stage检测模型中的经典模型,较好地兼顾了检测精度和速度,因此应用较为广泛。本专利以YOLOv4检测模型作为主模型,在保证检测精度的情况下,首先,将三尺度检测模型改进为双尺度时序+非时序检测模型。其次,对双尺度检测模型进行了通道裁剪。本发明就是着力于目标小在视频时序目标检测中造成的难题。本发明在小目标检测领域有一定的通用性,并针对无人机视频中存在的目标模糊做了特殊改进。
实验表明,两种改进方法均达到了小目标检测领域减小模型内存占用,提升检测速度以及精度的目的。
发明内容
为了克服上述现有技术的不足,本发明提出了一种基于通道裁剪的无人机视频小目标检测方法。该技术引用了深度学习中的通用目标检测框架YOLOv4,并由于内存、算力有限而导致检测模型部署困难、检测精度降低的问题对YOLOv4进行了进一步的改进。
本发明所采用的技术方案是:
步骤1:YOLOv4模型结构改进针对目标尺寸特点,对原模型的检测层进行了改进,保留了负责从52×52和26×26特征图中检测中小目标的YOLOHead1和YOLOHead2模块。移除了负责检测大目标的YOLOHead3模块和其相关的采样卷积过程,但保留了与之对应的13×13特征图;
步骤2:步骤1中模型中小尺度YOLOHead1对应的初始候选框大小为[12,16,19,36,40,28],中尺度YOLOHead2对应的初始候选框大小为[36,75,76,55,72,146];
步骤3:进行模型通道裁剪首先需要对BN层进行稀疏化训练,本方法通过在初始损失函数中引入L1正则化来对BN层的缩放因子γ进行稀疏化训练,每个特征通道对应一个缩放因子γ;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于一拓通信集团股份有限公司,未经一拓通信集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111567636.0/2.html,转载请声明来源钻瓜专利网。