[发明专利]一种基于级联区域生成网络和增强随机森林的行人检测方法在审
申请号: | 201711142150.6 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107944369A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 张建新;张小涛;张强 | 申请(专利权)人: | 大连大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
代理公司: | 大连八方知识产权代理有限公司21226 | 代理人: | 卫茂才 |
地址: | 116622 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 级联 区域 生成 网络 增强 随机 森林 行人 检测 方法 | ||
技术领域
本发明涉及行人检测领域,具体涉及一种基于级联区域生成网络和增强随机森林机制的行人检测方法。
背景技术
行人检测技术由于应用的广泛性使其在计算机视觉领域成为一个重要分支,对视频监控、车辆辅助驾驶智能机器人等多个领域提供了重要的技术支持。然而现实生活中由于行人在衣着上的多样性、形态变化的多样性、所处背景的多样性、光照强弱的多样性、行人之间相互遮挡使得行人检测存在着诸多需要解决的问题。近几年发展起来的Faster RCNN的目标检测方法,将窗口提取方法由滑动窗口发展到区域生成网络,新提出的区域生成网络方法将网络中的各个卷积层的特征用来预测类别相关的候选区域。这种方法大大降低了窗口提取的耗时问题,用最少的候选窗口达到最终候选区域同样的功能。这样,使得目标检测的流程变得精简,精度越来越高,速度也越来越快。
由于行人检测在目标检测领域的特殊性,为解决Faster RCNN在行人检测领域效果不理想的问题,研究者提出了基于区域生成网络和引导随机森林的机制进行行人检测。“RPN+BF”的方法通过从更浅层的但是分辨率高的层上来进行特征的采样,利用“Hole”算法来增加特征映射的尺寸。通过重新利用的卷积特征来训练随机森林,这种策略不但通过共享特征降低了分类器的计算代价,也探索了深度学习到的特征。上述方法在行人检测领域取得了显著效果,但由于现在数据集规模较大,也存在利用RPN提取的候选区域数量较多,耗时过多,区域生成网络对特征的分类效果还不是太理想等问题。
发明内容
鉴于以上缺陷,本发明提出了一种基于级联区域生成网络和增强随机森林的行人检测方法“CASRPN+BF”,对区域生成网络提取的候选区域导入级联的区域生成网络框架中进行候选框进一步的筛选和修正,对行人检测的候选区域的训练的耗时性和行人检测的精度都进行了提升。
为实现上述发明目的,本发明采用以下技术方案:
步骤1:采用卷积神经网络在行人图像上提取行人图像特征;
步骤2:采用级联区域生成网络在上述的行人图像特征上进行候选框的提取,根据提取的候选框的置信度值的高低,选取置信度较好的候选框作为行人候选区域,行人候选区域和对应的置信度值被用于后续行人检测器的训练。经过级联区域生成网络提取的候选区域,置信度较好的数量增多,从中挑选的候选区域的质量更高;
步骤3:基于步骤1提取的行人图像特征和基于步骤2选取的行人候选区域以及与行人候选区域相对应的置信度值,将三者一起导入增强型的随机森林分类器训练行人检测模型,完成对行人的检测;相对于其他分类器,增强型的随机森林分类器更为灵活,对输入数据的限制较少,效果也较为理想。
进一步地,步骤1中行人图像特征的提取利用卷积神经网络VGG框架,针对行人图像检测的特殊性,选取conv3_3层卷积特征作为共享特征使用。
进一步地,步骤2中级联区域生成网络是根据下面方法模型对行人候选区域进行进一步的筛选和修正的:
其中,i表示行人候选区域的索引,pi表示区域生成网络生成候选区域中行人分类预测概率,pi*代表候选区域对应的行人标签概率,pi'表示级联区域生成网络生成候选区域中行人分类预测概率,(pi')*代表级联后候选区域对应的行人标签概率;t代表区域生成网络预测的行人候选区域,ti'代表级联区域生成网络预测的行人候选区域,t*代表对应的行人区域标签。
进一步地,步骤3中增强型随机森林分类器,分6个人阶段来逐渐增强得到行人检测器。
具体的,步骤1包括以下具体步骤:
(1)对于一副任意大小P×Q的图像,首先缩放为固定大小M×N,记录缩放比例。然后将M×N图像送入卷积神经网络,这里采用VGG-16网络框架进行图像原始特征的提取;
(2)考虑到常规场景下的行人检测,如自动驾驶和智能监控,行人的尺寸都是很小,低分辨率的特征映射上可能导致特征不明显。这些特征在小物体上不具有区分性,这里选取分辨率较高的conv3_3卷积层的特征进行后续的操作。
步骤2包括以下具体步骤:
(1)在特征图上使用3*3的卷积核与特征图进行卷积,然后将每个特征图的位置编码成一个特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711142150.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:手机保护套
- 下一篇:基于DCCGAN模型的极化SAR图像分类方法