[发明专利]基于扩大感受野的红外目标检测方法在审
申请号: | 202111122570.4 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113902896A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 宋江鲁奇;李苗青;周慧鑫;李欢;刘国均;向培;张嘉嘉;张喆;李怡雨;王瑛琨;田成;刘志宇;白宇婷;秦翰林;王炳健 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/143;G06V10/80;G06K9/62;G06N3/04 |
代理公司: | 西安志帆知识产权代理事务所(普通合伙) 61258 | 代理人: | 侯峰;韩素兰 |
地址: | 710065 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 扩大 感受 红外 目标 检测 方法 | ||
1.一种基于扩大感受野的红外目标检测方法,其特征在于,该方法为:
构建用于提取特征的基础网络结构;
将图像输入所述基础网络结构,经过多个卷积层逐层卷积,在不同的卷积层分别获得图像的低层特征图和高层特征图;
通过在低层特征分支后添加设计构建的感受野模块RFB-d与RFB-w进行处理来扩大感受野,获得语义信息丰富的低层特征图;
对所述语义信息丰富的低层特征图和高层特征图分别预测该特征图上每个网格对应的每个预测框所属的分类与边界框;
通过非极大值抑制算法合并边界框,输出整个网络最终的预测结果。
2.根据权利要求1所述的基于扩大感受野的红外目标检测方法,其特征在于,所述构建用于提取特征的基础网络结构,具体为:以MobileNet为基础,通过重复堆叠多个不同的深度可分离卷积模块进行构建,输入图像经过3×3的标准卷积层进行下采样,然后卷积前进方向上叠加13个深度可分离卷积模块DWS,深度可分离卷积模块中,深度卷积对输入特征图的每个通道都单独使用不同的卷积核来进行特征提取,逐点卷积用来改变输出通道的数量来对信息进行跨通道整合。
3.根据权利要求1或2所述的基于扩大感受野的红外目标检测方法,其特征在于,所述将图像输入所述基础网络结构,经过多个卷积层逐层卷积,在不同的卷积层分别获得图像的低层特征图和高层特征图,具体为:将输入图像经由深度卷积模块DWS处理得到的DWS11和DWS13的输出矩阵作为图像的低层特征图;在深度卷积层DWS13后再直接添加4个额外的卷积层C14、C15、C16、C17,其中该四层每一层的输出作为图像的高层特征图。
4.根据权利要求3所述的基于扩大感受野的红外目标检测方法,其特征在于,所述通过在低层特征分支后添加设计构建的感受野模块RFB-d与RFB-w进行处理来扩大感受野,获得语义信息丰富的低层特征图,具体为:将低层特征图经RFB-d进行处理,获得4个分支的输出结果对应级联,并且在通道维度上进行拼接后通过RFB-w模块进行处理,获得语义信息丰富的低层特征图。
5.根据权利要求4所述的基于扩大感受野的红外目标检测方法,其特征在于,所述将低层特征图经RFB-d进行处理,获得4个分支的输出结果对应级联,具体为:RFB-d模块共有4个分支结构,对于上一层输入:
(1)分支1经过1×1的卷积层产生输出;
(2)分支2经过1×1的卷积层降低通道的维度,在卷积层后添加3×3空洞率为1的膨胀卷积;
(3)分支3先经过1×1的卷积层降低通道维度,再将3×3的卷积层分解为级联的1×3和3×1的卷积操作,并添加3×3空洞率为2的膨胀卷积;
(4)分支4先经过1×1的卷积层降低通道维度,再将5×5的卷积层分解为3×3的两个级联卷积层,并进一步分解为1×3和3×1的卷积层,并添加3×3空洞率为4的膨胀卷积;
将以上4个分支的输出结果对应级联,最后在通道维度上进行拼接,输入下一个RFB-w模块。
6.根据权利要求5所述的基于扩大感受野的红外目标检测方法,其特征在于:将通过RFB-w模块进行处理,获得语义信息丰富的低层特征图,具体为:RFB-w模块共有4个分支结构,对于上一层输入:
(1)分支1经过1×1的卷积层产生输出;
(2)分支2经过1×1的卷积层,并在卷积层后添加3×3空洞率为1的膨胀卷积;
(3)分支3先经过1×1的卷积层降低通道维度,再将3×3的卷积层分解为并联的1×3和3×1的两个卷积分支,并分别在两个卷积分支后添加3×3空洞率为2的膨胀卷积,生成两个输出结果;
(4)分支4先经过1×1的卷积层降低通道维度,再将5×5的卷积层分解为3×3的两个级联卷积层,进一步将其中一个分解为并联的1×3和3×1的两个卷积分支,并分别在两个卷积分支后添加3×3空洞率为4的膨胀卷积来扩大感受野,生成两个输出结果;
将以上4个分支的6个输出结果对应级联,最后在通道维度上进行拼接,作为语义信息丰富的低层特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111122570.4/1.html,转载请声明来源钻瓜专利网。