[发明专利]基于目标检测的多尺度特征融合方法在审
申请号: | 202210303602.9 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114694003A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 王改华;甘鑫;曹清程;翟乾宇;刘洪 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V10/44;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉宇晨专利事务所(普通合伙) 42001 | 代理人: | 余晓雪 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 目标 检测 尺度 特征 融合 方法 | ||
本发明属于目标检测领域,涉及一种基于目标检测的多尺度特征融合方法,包括以下步骤:1)将不同尺寸的特征图进行卷积处理后得到通道数相同的特征图;2)将步骤1)获取得到的特征图分别进行通道维度融合处理以及空间维度融合处理,分别得到通道维度融合处理特征图以及空间维度融合处理特征图;3)将步骤2)所获取得到的通道维度融合处理特征图以及空间维度融合处理特征图进行融合处理,实现对不同尺寸的特征图在空间和通道两个维度的特征融合。本发明提供了一种可显著提升检测精度的基于目标检测的多尺度特征融合方法。
技术领域
本发明属于目标检测领域,涉及一种特征融合方法,尤其涉及一种基于目标检测的多尺度特征融合方法。
背景技术
目标检测的主要任务是从输入图像中定位感兴趣的目标,然后准确地判断每个感兴趣目标的类别。当前的目标检测技术已经广泛地应用于日常生活安全、机器人导航、智能视频监控、交通场景检测及航天航空等领域。
在深度学习的发展背景下,卷积神经网络已经得到越来越多的人认同,应用也越来越普遍。基于深度学习的目标检测算法利用卷积神经网络(CNN)自动选取特征,然后再将特征输入到检测器中对目标分类和定位。
在一张图片中,物体的尺寸大小是不同的。如果都采用相同尺寸的特征图训练,则效果很不理想,如果将特征图裁剪成不同的尺寸分多次输入训练,则大大地增加了网络的复杂度和训练时间。在目标检测算法中,为了解决对不同尺寸物体的预测问题,Lin等人提出了著名的特征金字塔网络FPN,如图1所示,其基本思想在于结合浅层特征图的细粒度空间信息和深层特征图的语义信息对多尺度的目标进行检测。在此基础上,又有许多人提出了改进的FPN结构。Liu等人提出了PANet,该网络先采用上采样融合不同尺寸的特征图,在此基础上再进行下采样特征融合,重新构建了一个强化了空间信息的金字塔;GolnazGhaisi等人提出了NAS-FPN,该网络在一个覆盖所有交叉尺度连接的可扩展搜索空间中,采用神经网络结构搜索,可以跨范围地融合特性;Guo等人提出了AugFPN,该网络针对FPN存在的缺陷采用了Consistent Supervision,Residual Feature Augmentation和Soft RoISelection;Tan等人提出了BiFPN架构,BiFPN同样对特征进行加权融合,让网络能学习到不同输入特征的重要性;Siyuan Qiao等人提出了Recursive-FPN,该网络将传统FPN的融合后的特征图再输入给Backbone,进行二次循环。金字塔网络FPN可以平衡目标的分类准确性和定位准确性,有效地解决多尺度预测问题。但是该结构只是在空间结构上对特征进行有效融合,不同的通道之间的信息可能存在关联或者冗余。
发明内容
为了解决背景技术中存在的上述技术问题,本发明提供了一种可显著提升检测精度的基于目标检测的多尺度特征融合方法。
为了实现上述目的,本发明采用如下技术方案:
一种基于目标检测多尺度特征融合方法,其特征在于:所述基于目标检测多尺度特征融合方法包括以下步骤:
1)将不同尺寸的特征图进行卷积处理后得到通道数相同的特征图;
2)将步骤1)获取得到的特征图分别进行通道维度融合处理以及空间维度融合处理,分别得到通道维度融合处理特征图以及空间维度融合处理特征图;
3)将步骤2)所获取得到的通道维度融合处理特征图以及空间维度融合处理特征图进行融合处理,实现对不同尺寸的特征图在空间和通道两个维度的特征融合。
作为优选,本发明所采用的步骤1)的具体实现方式是:
1.1)获取不同尺寸的特征图,所述不同尺寸的特征图最少包括特征图C3、特征图C4以及特征图C5;其中特征图C3的尺寸是特征图C4的2倍;特征图C4的尺寸是特征图C5的2倍;
1.2)对不同尺寸的特征图进行经过卷积处理,使得卷积处理后的通道数相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210303602.9/2.html,转载请声明来源钻瓜专利网。