[发明专利]一种基于YOLOv4多尺度特征融合的红外小目标检测方法在审
申请号: | 202211262382.6 | 申请日: | 2022-10-14 |
公开(公告)号: | CN115546502A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 任获荣;黄雪影;赵毅 | 申请(专利权)人: | 西安镭映光电科技有限公司 |
主分类号: | G06V10/42 | 分类号: | G06V10/42;G06V10/44;G06V10/82;G06V10/80;G06V10/766;G06N3/04;G06N3/08 |
代理公司: | 郑州知倍通知识产权代理事务所(普通合伙) 41191 | 代理人: | 邱珍珍 |
地址: | 710071 陕西省西安市高新*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolov4 尺度 特征 融合 红外 目标 检测 方法 | ||
1.一种基于YOLOv4多尺度特征融合的红外小目标检测方法,其特征在于:含有以下步骤,
步骤1、获取红外小目标检测图像,对图像进行预处理,调整为统一尺寸;
步骤2、提取图像的全局特征,对目标区域进行扩张卷积,将扩张卷积获取的特征嵌入全局分支中,学习目标区域的上下文信息;
步骤3、使用滑动窗口对原始图像进行采样,将采样后的图像块序列进行下采样降低原始图像分辨率,得到的低分辨率图像用于训练生成对抗网络模型,将滑动窗口采样的图像块序列输入训练好的生成对抗网络模型,获取局部特征增强的图像;
步骤4、将步骤3得到的图像输入YOLOv4的主干网络,将主干网络输出的局部增强的特征、步骤2中获取的全局特征和上下文特征,通过学习不同的权值相互融合;
步骤5、融合后的模块输入空间自注意机制,增强红外小目标在空间结构中的依赖响应;
步骤6、计算损失函数,通过YOLOv4的头部网络对红外小目标位置回归,得到最终的检测结果。
2.根据权利要求1所述的基于YOLOv4多尺度特征融合的红外小目标检测方法,其特征在于:所述步骤1中输入待检测图像,采用Opencv中的resize()函数,将尺寸调整到同一大小。
3.根据权利要求1所述的基于YOLOv4多尺度特征融合的红外小目标检测方法,其特征在于:所述步骤2中获取输入图像的全局特征信息包括以下步骤:
步骤2.1、将待检测图像输入卷积神经网络进行特征提取,抽象出目标对象的全局特征表示;
步骤2.2、引入扩张卷积,学习上下文信息,增强全局特征提取的表示能力;
步骤2.3、将上下文信息嵌入全局分支当中,获取更加完整的特征信息与先验表示。
4.根据权利要求1所述的基于YOLOv4多尺度特征融合的红外小目标检测方法,其特征在于:所述步骤3中构建生成对抗网络模型,获取局部特征增强的高分辨率图像,包括以下步骤:
步骤3.1、设置滑动窗口的尺寸大小为16×16,滑动步数为12;
步骤3.2、采用双三次插值方法对滑动窗口图像序列进行下采样得到低分辨率图像;
步骤3.3、将得到的水平方向和垂直方向都缩放为原来一半的图像输入生成器,鉴别器为正常图像序列,引入随机噪声,通过生成器与鉴别器的对抗学习,计算损失函数,训练生成对抗网络模型;
步骤3.4、将滑动窗口采样的图像块序列输入训练好的生成对抗网络模型,获取局部特征增强的高分辨率图像。
5.根据权利要求1所述的基于YOLOv4多尺度特征融合的红外小目标检测方法,其特征在于:所述步骤4中融合全局特征与局部增强特征包括以下步骤:将得到的高分辨率图像输入YOLOv4的主干网络,通过CSPDarknet53输出的不同尺度的特征,输出的不同尺度特征与步骤2中获得的全局特征设置不同的权重,卷积后将不同尺度的特征进行融合相加。
6.根据权利要求1所述的基于YOLOv4多尺度特征融合的红外小目标检测方法,其特征在于:所述步骤5将融合后的模块输入空间自注意机制,包括以下步骤:步骤5.1、设置特征融合模块的输出特征图为[C×H×W],H、W和C分别表示特征映射的高度、宽度和通道;
步骤5.2、将其输入三个1×1卷积中,生成三个特征映射F1、F2和F3;
步骤5.3、通过重构F1、F2和F3,衡量特征图不同位置之间的影响,首先对F1的转置以及F2进行矩阵乘法;然后通过Softmax归一化函数操作得到F4;
步骤5.4、最后,对F3和F4进行矩阵乘法运算,得到最终的输出[C×H×W]。
7.根据权利要求1所述的基于YOLOv4多尺度特征融合的红外小目标检测方法,其特征在于:所述所述步骤6中,定义总体损失函数:
Loss=LGAN+LClass+LBox
其中,LGAN、LClass、LBox分别为生成对抗网络模型损失函数、分类损失函数和边界框回归损失函,
分类损失函数具体定义如下:
其中,和分别表示第i格第j个边界框中对象所属类别c的预测概率和真实概率;
边界框回归损失函数具体定义如下:
其中,IOU表示预测边界框和真值边界框的并集的交集,wgt、hgt分别是边界框的真值宽度和高度,w和h分别为预测的包围框宽度和高度,ρ2(b,bgt)表示预测边界框和真值边界框中心点之间的欧氏距离,c表示预测边界框和真值边界框的最小对角线距离,根据目标对象的真类和模型预测类,可以将样本数据分为真阳性(TP)、假阳性(FP)、真阴性TN)和假阴性(FN)四类,最后通过查全率、查准率和F1来评判网络结构的检测准确率,具体公式如下:
其中F表示预测为目标中真实目标的比例,R表示被成功预测的比例,F1表示红外小目标检测网络的精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安镭映光电科技有限公司,未经西安镭映光电科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211262382.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置及其显示面板
- 下一篇:一种高温碳酸盐岩储层深部酸化方法