[发明专利]针对固定野外场景中样本缺失情况下的行人检测方法在审
申请号: | 201611144678.2 | 申请日: | 2016-12-13 |
公开(公告)号: | CN108229242A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 骆小飞;范柘 | 申请(专利权)人: | 上海安维尔信息科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 王法男 |
地址: | 201203 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人检测 数据库 样本 野外 检测器 场景 标记信息 格式统一 实验数据 提取特征 行人数据 训练模型 融合 | ||
本发明涉及针对固定野外场景中样本缺失情况下的行人检测方法,步骤如下:步骤1:融合各大行人检测数据库;将各个数据库中的行人数据融合,主要是将各个数据库的标记信息的格式统一,方便后续训练处理。步骤2:训练一个基于各种公开数据库的行人检测模型;用基于ResNet‑101提取特征的R‑FCN检测器来训练模型。步骤3:构造实验数据。
技术领域
本发明针对固定野外场景中样本缺失情况下的行人检测方法,核心算法是深度学习方向的目标检测。
背景技术
目标检测就是“给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标的具体类别”。目标检测在智能化交通系统、智能监控系统、军事目标检测及医学导航手术中手术器械定位等方面具有广泛的应用价值。
目标检测对于人来说是再简单不过的任务,但是对于计算机来说,它看到的是一些值为0~255的数组,因而很难直接得到图像中有人或者猫这种高层语义概念,也不清楚目标出现在图像中哪个区域。图像中的目标可能出现在任何位置,目标的形态可能存在各种各样的变化,图像的背景千差万别……,这些因素导致目标检测并不是一个容易解决的任务。
得益于深度学习——主要是卷积神经网络(convolution neural network:CNN)和候选区域(region proposal)算法,从2014年开始,目标检测取得了巨大的突破。目前流行的目标检测策略主要有以下两种:1、以R-CNN为代表的结合region proposal和CNN分类的目标检测框架(包括:R-CNN,SPP-NET,Fast R-CNN,Faster R-CNN还有R-FCN);2、以YOLO为代表的将目标检测转换为回归问题的目标检测框架(包括:YOLO,SSD);
虽然现在学术界有着各种带人工标记的检测数据库(VOC,COCO……),但是真实问题中往往没有现成的人工标记,甚至会出现图像场景中只存在少量或者根本没有前景等极端问题。比如本案例,想训练一个野外高铁场景的行人检测器,当镜头中出现行人时及时做出警报,提醒附近的工作人员进行疏散处理。但是,真实场景中很难在高铁铁轨附近发现行人。缺少人工标记可以通过消耗人力物力来弥补,但是一旦数据中缺少或者不存在前景,极端的正负样本比例会使得卷积神经网络在训练过程中梯度无限偏向负样本,导致漏检率极高。因此目前流行的基于深度学习的算法都无法越过这个障碍。而传统的不使用卷积神经网络框架的显著性检测算法无法解决诸如光照,阴影,风吹草动,甚至高铁路过等常见干扰而被人诟病。
因此现在存在着野外高铁场景中行人数据缺失以及需要检测场景中的行人这一矛盾,本发明针对该矛盾而提出一种全新的思路。
发明内容
发明针对现有算法无法处理前景缺失的目标检测问题,提出一种灵活、精度高、速度快、稳定性好、实时性强、方法简单、通用性强的目标检测框架。
按照本发明提供的技术方案,步骤如下:
第一步:融合各大行人检测数据库;
从网上搜索各大行人检测数据库(如MIT数据库、INRIA数据库、Daimler行人数据库,Caltech行人数据库等)。将各个数据库中的行人数据融合,主要是将各个数据库的标记信息的格式统一,方便后续训练处理。
第二步:训练一个基于各种公开数据库的行人检测模型;
由于本发明这里使用的检测器R-FCN是目前检测任务中效果最好的几个模型之一,而深度学习的经验告诉我们,当我们的模型拟合能力很强的时候,数据量越多,数据多样性越全,模型的检测效果越好。根据上面下载的融合数据库,用基于ResNet-101提取特征的R-FCN检测器来训练模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海安维尔信息科技股份有限公司,未经上海安维尔信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611144678.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示模组及其使用方法
- 下一篇:一种智能车前方车辆的检测方法