[发明专利]基于深度学习融合通道混洗的红外目标检测方法在审
申请号: | 202111122583.1 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113936136A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 周慧鑫;陈戈韬;宋江鲁奇;刘国均;李欢;秦翰林;王炳健;滕翔;张鑫;李幸;梅峻溪;刘志宇;张喆 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/143;G06V10/80;G06K9/62;G06N3/04 |
代理公司: | 西安志帆知识产权代理事务所(普通合伙) 61258 | 代理人: | 侯峰;韩素兰 |
地址: | 710065 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 融合 通道 红外 目标 检测 方法 | ||
本申请公开了一种基于深度学习融合通道混洗的红外目标检测方法,该方法包括:将原始图像输入预设网络,提取原始图像的特征图;将特征图输入候选框生成层;将特征图输入RPN网络,确定候选框,并输出候选框至候选框生成层;候选框生成层将候选框在输入特征图进行映射,得到候选框特征图;将候选框特征图通过池化层调整为固定大小的固定特征图;将固定特征图输入至完全连接层,固定特征图通过softmax层输出类别,固定特征图通过线性回归层输出对应的边界框,得到原始图像的目标检测结果图。该方案在提高检测速度的同时保证了检测的精度。
技术领域
本发明一般涉及图像处理技术领域,具体涉及一种基于深度学习融合通道混洗的红外目标检测方法。
背景技术
目标检测一直是图像处理和计算机视觉领域最基本和最具挑战性的热点问题之一。无论是在可见光场景还是红外场景下,目标检测都有着非常广泛的应用,如自动驾驶、智能监控和军事侦查等。目前可见光场景下使用基于深度学习的目标检测算法已经取得了突飞猛进的发展,而在红外场景下的应用推进较慢。相比可见光图像,红外图像缺少颜色、纹理等特征,具有信噪比低、对比度低和分辨率低等局限性。传统方法使用的手工提取特征很大程度上依靠经验且适应性较差,而基于深度学习的方法具有强大的自动特征学习能力,能够提高检测的精度。
目前,对于基于深度学习的基于深度学习融合通道混洗的红外目标检测方法,按处理流程可以分为两类,一类是两阶段的目标检测,此方法将检测任务分为两个阶段,第一阶段生成可能存在目标的候选框,第二阶段对这些候选框利用卷积神经网络(Convolutional Neural Networks,CNN)提取特征并进行分类和位置回归,该类检测算法具有较高的检测精度优势,但是检测速度较慢。另一类是单阶段的目标检测,此方法不需要生成候选框,可以直接对图像上的目标同时进行分类和回归。该类检测算法具有较快的检测速度,但是检测精度通常不如两阶段检测算法。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种基于深度学习融合通道混洗的红外目标检测方法。
本发明提供了一种基于深度学习融合通道混洗的红外目标检测方法,该方法包括:
将原始图像输入预设网络,提取原始图像的特征图;
将特征图输入候选框生成层;
将特征图输入RPN网络,确定候选框,并输出候选框至候选框生成层;
候选框生成层将候选框在输入特征图进行映射,得到候选框特征图;
将候选框特征图通过池化层调整为固定大小的固定特征图;
将固定特征图输入至完全连接层,固定特征图通过softmax层输出类别,固定特征图通过线性回归层输出对应的边界框,得到原始图像的目标检测结果图。
在其中一个实施例中,预设网络构建包括:
采用标准卷积进行卷积操作,并设置预设步长进行下采样;
在卷积前进方向叠加深度可分离卷积模块;
在深度可分离卷积模块后加入融合通道混洗的深度可分离卷积模块;融合通道混洗的深度可分离卷积模块的步长包括第一步长和第二步长,第一步长与第二步长不等;
加入卷积层,用于使预设网络的输出通道数量适应后续层。
在其中一个实施例中,融合通道混洗的深度可分离卷积模块为2 个。
在其中一个实施例中,基于残差的融合深度可分离卷积模块为6 个。
在其中一个实施例中,深度可分离卷积模块包括深度卷积和逐点卷积;
深度卷积用于改变特征图的尺寸,利用单通道的卷积核对输入进行滤波;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111122583.1/2.html,转载请声明来源钻瓜专利网。