[发明专利]用编码向量的行人图像检测自适应非极大值抑制处理方法有效
申请号: | 201910936327.2 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110909591B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 朱建科;张加良;杨雨 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/46;G06V10/774;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 向量 行人 图像 检测 自适应 极大值 抑制 处理 方法 | ||
本发明公开了一种用编码向量的行人图像检测自适应非极大值抑制处理方法。行人图像进行特征提取,获得多幅特征图,特征图中包含有身份信息和密度信息,进而通过网络模型处理获得候选检测框;针对所有候选检测框利用多幅特征图采用非极大值抑制算法进行迭代处理,优化获得行人目标的检测框作为检测结果。本发明方法通过神经网络模型学习检测框编码向量,具备表达行人检测框的密度信息与身份信息的能力,有效地解决了在行人检测中显著的行人相互遮挡问题。
技术领域
本发明涉及计算机视觉目标检测领域,设计了一种基于编码向量加入图像行人检测框密度信息和身份信息的行人图像检测自适应非极大值抑制算法
背景技术
行人检测是计算机视觉领域的一个重要分支,在自动驾驶、智能视频监控、智能机器人等领域有着重要的应用。由于行人姿态、体型、穿着的变化,自然场景下光线、环境的变化以及部分遮挡的问题使得行人检测仍旧是一个挑战。
行人检测作为目标检测的一个特定任务,其发展历程与目标检测具有一致性。一般地,可以将目标检测分为基于锚点的方法和最新的无锚点的检测方法。其中基于锚点的方法,如Faster-RCNN、SSD以及它们的变形在过去几年中占有主导地位;而无锚点的方法,如ComerNet、CenterNet、CSP展现了它们不错的结果以及灵活的结构设计。的探测器是基于无锚点的方法。
行人检测无锚点的算法思想是通过深度学习提取具有高级语义的特征。具体地,将行人检测中行人的中心点坐标和检测框的尺度(宽和高)作为高级语义特征,那么行人检测就完全可以转化为这些语义特征的检测。对于一张输入的图像,经过卷积神经网络分成中心点特征图和尺度特征图,计算得到中心点的坐标和检测框的尺度,即可检测出行人。
作为目标检测的特定任务,行人检测具有自身的特点,其中人群的遮挡问题是重要挑战之一。在最新的行人检测数据集CrowdHuman中,人群的密集水平变得很高,以RFB-Net为骨干的基于密度信息的自适应非极大值算法在此数据集上进行行人检测,丢失率从12.7%升高到了63.03%,可见拥挤环境下的行人检测是一个关键问题。
为了解决这个问题,目前有以下几种方法:1.采用恒定的非极大值抑制阈值,通过提出额外的损失来约束回归目标,以产生更紧凑的检测框,从而降低NMS 阈值的影响;2.采用软非极大值抑制,对检测框进行重新估分,对较差的框抑制其分数而不是直接过滤;3.采用自适应的非极大值抑制,通过一种估计检测框密度的方法,来自适应地设置NMS算法的阈值。
然而这些算法仍未能很好地解决拥挤环境下的行人检测问题,准确率仍有较大的提升空间。
发明内容
为了解决背景技术中存在的问题,本发明基于无锚点的行人检测算法,在 CSP(Centerand Scale Prediction)的基础上扩展了一个身份-密度分支,并提出了一种针对检测框抑制的自适应非极大值抑制算法,是一种结合考虑行人检测框的密度信息与身份信息的自适应非极大值抑制算法。
如图1所示,本发明采用的技术方案具体步骤如下:
1)行人图像进行特征提取,获得多幅特征图,一幅特征图中包含有身份信息和密度信息,进而通过网络模型处理获得候选检测框;
2)针对所有候选检测框利用多幅特征图采用非极大值抑制算法进行迭代处理,优化获得行人目标的检测框作为检测结果。
本发明提出了的一种自适应的非极大值抑制算法,能够根据检测框的密度信息及检测框之间的距离信息,自适应地计算非极大值抑制的阈值,从而对多余的检测框进行抑制。
本发明进行检测框的抑制可以尽可能地抑制同一对象上的不同检测框,并保留不同对象上的检测框,极大地提高了行人检测的效果。
所述步骤1)具体分为两个阶段:
在模型训练阶段:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910936327.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序