[发明专利]一种面向无人机航拍图像的小目标检测方法在审
申请号: | 202210488938.7 | 申请日: | 2022-05-07 |
公开(公告)号: | CN114863301A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 张红英;张奇;罗向东 | 申请(专利权)人: | 西南科技大学 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06N3/04;G06N3/08;G06V10/764;G06V10/80;G06V10/82 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 612010 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 无人机 航拍 图像 目标 检测 方法 | ||
本发明给出一种面向无人机航拍图像的小目标检测方法。首先,针对目标尺寸较小的问题,改变了检测头尺寸,以获得更多小目标的原始信息;其次,为了在复杂场景中准确检测到密集连续的小目标,在特征提取阶段采用融合了CBAM注意力机制的残差卷积模块,为训练图片中密集连接的感兴趣区域增加权重;然后,为了缓解背景杂乱,像素模糊带来的问题,引入跳跃多尺度特征增强模块,在自顶向下的特征融合中增加两条相同尺度残差路径,三条跨尺度残差路径,将浅层特征信息和深层特征信息充分融合,让不同尺度的检测头得到足够的图像语义信息和空间信息。本发明利用多方向跳跃残差连接路径融合图像多尺度特征,实现了优异的小目标检测性能,具有广泛的适用性。
技术领域
本发明涉及图像处理技术,具体来讲,涉及一种面向无人机航拍图像的小目标检测方法,该方法结合多尺度特征融合和注意力机制,构建鲁棒的小目标检测网络。
背景技术
目标检测结合了目标定位与目标分类两大任务,是解决分割、场景理解、目标跟踪、图像描述和事件检测等更高层次视觉任务的基础。目标检测算法的研究从最初的基于滑动窗口的方式来获取预测目标的位置,随着深度学习的崛起出现了基于区域建议生成来提取感兴趣区域的目标检测算法,基于anchor的RPN很快取代了区域建议生成这种方式。由此,anchor广泛应用于各种目标检测应用中。但由于anchor的尺寸固定不能灵活的适应不同尺度目标的预测,并且限制着模型的泛化能力,且密集的anchor会加重正负样本的不平衡性,同时会显著增加计算量和内存占用,所以anchor-free的目标检测方法逐渐发展起来。
无人机由于具有成本低、体积小、分辨率高、机动灵活、操纵方便、可以方便地获得各种环境下航拍图像的特点,广泛应用于交通监控、电力巡检、军事巡查、环境监管等不易于人为操作的行业,因此对无人机目标检测的研究很有意义。无人机远距离拍摄图像具有背景复杂度高、目标尺寸小且外观模糊的特点,因此给无人机小目标检测任务带来了巨大挑战。小目标广泛存在于航拍图像,航拍图像中的自然场景通常存在光照剧烈变化、目标遮挡、目标稠密连接和目标尺度变化等问题,而这些因素对小目标特征的影响是更加剧烈的,进一步加大了小目标检测的难度。小目标检测中网络训练和目标预测主要集中在特征提取和特征融合之间,优秀的特征提取方式和特征融合方法可以为小目标检测带来关键的高频信息,克服由于小目标在原图中所占像素数较少,携带的信息有限,缺乏纹理、形状、颜色等外观信息,下采样使小目标的特征信息在深层特征图中弥散甚至消失的问题,所以丰富网络的上下文语义信息、位置信息和特征表示成为了无人机小目标检测任务的研究重点。
发明内容
本发明的目的在于解决无人机航拍图像中小目标检测准确率低,误检率和漏检率高的问题,提供不同光照环境、不同气候和场景下的航拍图像,通过深度学习网络训练得到检测模型进行小目标检测,经所述方法可提高小目标检测准确率,降低误检和漏检率。
为了实现上述目的,本发明基于YOLOX网络,提供一种面向无人机航拍图像的小目标检测方法,该方法采用多尺度跳跃残差路径的特征融合和嵌入了注意力机制的残差结构来达到更好的小目标检测,其包括五个部分:第一部分是对数据集进行预处理,第二部分是对无人机小目标数据集进行特征提取,第三部分是对于来自不同阶段的特征进行特征融合,第四部分是对融合后的特征图进行不同尺度的分类预测和回归预测,第五部分是网络训练与测试,得到无人机小目标检测的最优模型。
第一部分包括2个步骤:
步骤1,下载无人机小目标公开数据集,选取自然场景复杂、角度多样和光照变化剧烈的图像作为测试集,对测试集不进行任何的图像增强;
步骤2,对公开数据集的图片大小进行重置,将图片调整至640×640像素,对训练集中每一张图片进行四次分割、翻转,然后将翻转后的图片分别放置在对应分割位置上最后对图片进行色域变换等操作,增强训练样本集,得到最终的训练样本;
第二部分包括两个步骤:
步骤3,将步骤2的训练样本输入权值共享的卷积网络,通过卷积残差结构进行通道数变换,从RGB空间初步得到航拍图像的特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210488938.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序