[发明专利]一种基于Faster RCNN的多尺度密集行人检测方法在审
申请号: | 202010212877.2 | 申请日: | 2020-03-24 |
公开(公告)号: | CN111444816A | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 朱凯;胡东方;李林涛 | 申请(专利权)人: | 北京银河信通科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 faster rcnn 尺度 密集 行人 检测 方法 | ||
本发明涉及一种基于Faster RCNN的多尺度密集行人检测方法,属于目标检测和计算机视觉技术领域。本发明针对行人检测任务中,图像内行人尺寸大小不一、密集人群中行人重叠情况下容易出现漏检的问题,基于检测效果较好的Faster RCNN检测网络做出改进。首先,针对图像中的行人多尺度问题,固定RPN网络提取候选区域框过程中的anchor的比例,并根据行人真实标准框的统计分布信息,得到anchor的尺寸,以提高预测回归框的准确度,提升检测精度。针对密集人群中行人重叠情况的漏检情况,使用改进的NMS算法,减少重叠行人的相邻检测框的误除情况,提高行人检测的平均准确度,以此提升检测精度。
技术领域
本发明涉及一种基于Faster RCNN(快速区域卷积神经网络)的多尺度密集行人检测方法,属于目标检测和计算机视觉技术领域。
背景技术
随着人工智能技术的发展,行人检测技术已经成为计算机视觉领域的关键研究方向。行人检测的最重要的任务就是对行人目标进行准确定位。行人检测技术有很强的使用价值,可以与多人跟踪、行人重识别等技术结合,应用于汽车无人驾驶系统、智能机器人、智能视频监控、人体行为分析、人流量统计系统、智能交通领域。
目前的行人检测任务主要分为两类:一是基于传统图像特征的方法,二是基于深度学习的方法。基于传统图像特征的方法,主要通过手动构造行人特征,如HOG等,再结合SVM、Adaboost等分类器训练检测器来实现行人检测。但是,这种方法依赖于人工选取的行人特征,如果选取的特征表达能力不足,检测效果就会比较差。
相对于基于传统图像特征进行检测的方法,基于深度学习的方法不依赖于某一单一的特征,对于特征的利用率更高,这种方法具有更好的泛化性和鲁棒性,行人检测结果也更准确。但是,行人检测任务的难题在于图像中行人的多尺度问题和密集人群中检测不完全。在实际场景下,多个行人与摄像头之间的距离远近不一,摄像头捕获的图像中行人尺寸不同,而现有检测过程中的特征尺寸单一,无法覆盖所有的待检测行人尺寸,出现漏检情况,导致检测效果不佳。另外,在密集人群场景下,行人之间会出现重叠情况,检测出多个目标的候选区域框距离比较近时,在最终去掉重复任务的检测框时,容易误除,导致密集行人检测效果不佳。
发明内容
本发明的目的是为了解决多尺度以及密集行人情况下检测效果不佳的技术问题,提出一种基于Faster RCNN的多尺度密集行人检测方法。
本发明的目的是通过以下步骤实现的:
步骤1:获取行人检测数据样本,并制作数据集。
具体包括以下步骤:
步骤1.1:获取行人检测所需的用来训练和检测的数据样本。
步骤1.2:将获取的数据样本转化为VOC格式数据集。
步骤2:根据统计结果,确定RPN网络中适合行人目标的anchors的长宽比例和尺寸。
步骤3:根据所选择的anchor长宽比例和尺寸,以及行人检测任务修改网络参数,训练Faster RCNN网络,获取训练好的模型。
具体包括以下步骤:
步骤3.1:搭建训练模型。
步骤3.2:对Faster RCNN网络进行训练。
采用四阶段训练法。
阶段一:以端到端的模式单独训练RPN网络。
阶段二:使用阶段一得到的建议框来单独训练训练Fast RCNN网络。
阶段三:使用阶段二得到的网络初始化RPN模型,但训练时固定共享卷积层,只更新RPN网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京银河信通科技有限公司,未经北京银河信通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010212877.2/2.html,转载请声明来源钻瓜专利网。