[发明专利]一种基于新型特征金字塔网络的图像目标检测方法在审
申请号: | 202210048960.X | 申请日: | 2022-01-17 |
公开(公告)号: | CN114511006A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 潘晴;黄强;田妮莉 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06V10/80;G06V10/82;G06V10/46 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 戴绪霖 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 新型 特征 金字塔 网络 图像 目标 检测 方法 | ||
本发明公开了一种基于新型特征金字塔网络的图像目标检测方法,首先采用金字塔池化模块对输入的最高等级特征图处理,得到包含特征图不同大小区域上下文信息的多尺度特征,然后对所有等级的特征图进行降维和平均池化,得到通道数一致、大小一致的四个特征图,再送入两个1x1卷积层计算得到位置权重,并对四个特征图进行位置加权,然后采用3x3卷积对最高等级的特征图进行处理并自上而下相加融合得到五个特征图,最后在五个特征图上预测,得到目标检测结果。本发明不仅能解决混叠效应、高级语义信息被稀释和低级空间信息局限访问的问题,还能不复杂化特征金字塔网络的融合结构,生成更具有鉴别性的特征,提升不同类型的检测器的检测精度。
技术领域
本发明涉及数字图像处理的技术领域,尤其涉及到一种基于新型特征金字塔网络的图像目标检测方法。
背景技术
目标检测是指对图像中的物体同时进行位置和类别的估计,可用于现代社会如自动驾驶,安全帽检测、行人检测等场景中,目前主流的目标检测算法对不同尺度的目标,尤其是小目标的检测效果不佳。如何解决这一问题,并获得更准确的检测效果成为当前的研究热点。
目前主流的目标检测算法可大致分为两阶段检测器和单阶段检测器。两阶段目标检测器首先通过建议机制在特征图上产生了一些预定义的、密集的滑动窗口,以确定目标最有可能出现的区域,称为感兴趣区域。这些感兴趣区域进一步由检测网络处理,以边界框和相关的目标类别概率的形式输出目标检测结果。最后,应用非极大值抑制算法于检测结果,以消除重复或高度重叠的结果。单阶段目标检测器被设计为从输入图像中提取特征后直接在建议框中预测检测结果,先将图像输入到特征提取网络,通常是一个深度卷积神经网络,得到特征图,然后在特征图上产生一组密集的目标建议框并与标注框匹配来进行采样和标记,最后将标记的建议框输入到分类网络和回归网络中进行训练。这两类检测器对固定尺度的目标可以取得较好的检测效果,但对于不同尺度的目标,尤其是小目标,检测精度会大大降低。
为了改善对不同尺度的目标的检测效果,He等人提出特征金字塔网络(FPN),其通过一种自上而下的融合路径和横向连接的方法构建了一个特征图金字塔,该特征图金字塔结合了低分辨率、强语义的特征和高分辨率、弱语义的特征,输出五个级别的特征图,每个级别的特征图尺度不同,但都包含丰富的语义信息,检测器同时在这五个特征图对目标进行预测,从而改善对不同尺度目标的检测效果。但这种方法对相邻等级的特征图只是简单地通过最近邻插值法缩放到相同的尺度然后进行相加融合,没有考虑不同等级的特征图之间存在的语义差异,导致融合时会产生冗余甚至错误的信息,容易引发混叠效应导致检测效果不佳;另一方面,采用的自上而下的渐进式融合结构会使得包含目标空间结构细节的低级特征信息只能局限在最后一个融合阶段被访问,而包含完整目标上下文信息的高级语义信息被逐渐传输到较浅的层从而被稀释。
在FPN的基础上,L i u等人提出了PAFPN,在FPN中添加了自下而上的融合路径,有效缓解了高级语义信息被稀释与低级空间结构信息局限访问的问题,但两次的渐进式融合结构将引发更严重的混叠效应且使融合结构变得复杂;Tan等人提出了BiFPN,通过双向跨尺度连接和加权特征融合获得更好的检测效果,但每个等级的特征图都与其他等级的特征图连接会使特征金字塔网络的融合结构变得更加复杂;Pang等人提出了Ba l anced FPN,通过将所有等级的特征图缩放到中间等级特征图的大小相加取平均,并引入了注意力模块对融合特征进行细化,可以综合性地平衡各等级特征图上的各类特征信息,但没有针对性地考虑各级特征图上的特征信息。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于新型特征金字塔网络的图像目标检测方法,不仅能够有效解决传统特征金字塔网络融合结构所引发的混叠效应、高级语义信息被稀释和低级空间信息局限访问的问题,还能不复杂化特征金字塔网络的融合结构,生成更具有鉴别性的特征,对不同类型的目标检测器的检测精度皆可提升。
为实现上述目的,本发明所提供的技术方案为:
一种基于新型特征金字塔网络的图像目标检测方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210048960.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:卫星遥测压缩编解码方法和系统
- 下一篇:一种城市燃气全压力等级高精度仿真方法