[发明专利]一种基于深度学习技术的行人检测方法有效
申请号: | 201610541223.8 | 申请日: | 2016-07-11 |
公开(公告)号: | CN106203506B | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 张祝平;张成;徐平平;戴磊 | 申请(专利权)人: | 上海凌科智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习技术的行人检测方法,首先基于迁移学习采用“逐步迁移”的策略训练一个二分类模型来初始化最终模型参数;然后采用当前非常流行高效的Faster RCNN框架并加以改进来完成行人检测工作,其基于CNN特征,不仅可以处理任意尺度的图像,而且检测速度快。相比已公开发明专利,本发明所公开的方法并不需要对网络进行特殊的设计,充分利用了已有的可用数据,采用通用的网络结构依旧可以达到不错的实验效果,充分发挥了深度卷积网络的优势,具有设计简单,鲁棒性较佳,检测准确率高,漏检率低的优点。 | ||
搜索关键词: | 一种 基于 深度 学习 技术 行人 检测 方法 | ||
【主权项】:
1.一种基于深度学习技术的行人检测方法,其特征在于,包括训练阶段和测试阶段;测试阶段,只需要将待测图像输入训练所得的模型,即可得到结果;所述的训练阶段主要包括以下两个步骤:S1、模型初始化步骤;S2、模型训练步骤;S1所述的模型初始化步骤是基于迁移学习采用“逐步迁移”的策略微调(fine‑tuning)实现,包括以下子步骤:S11、准备数据,针对INRIA和ETH数据库,进行数据增强操作来扩充数据集;S12、利用ImageNet模型在INRIA和ETH这两个数据库所组成的混合数据集上进行微调,得到新的分类模型;S13、利用在步骤S12中所获得分类模型,在Caltech数据库上进行微调,得到一个新的分类模型;S2所述的模型训练步骤是基于改进的Faster RCNN框架实现,所述基于改进的Faster RCNN框架包含如下子步骤:S21、准备数据集,考虑到Catlech行人数据是全标注的视频同时正负样本的分布不均衡性质,利用过采样来扩充数据集;S22、修改网络结构,整个网络包括候选窗口网络(Region Proposal Networks,RPN)和快速区域卷积神经网络(Fast Region‑Based Convolutional Neural Networks,FRCN),并利用“交叉优化”策略来训练完成;S22中所述的“交叉优化”策略训练方式包括以下子步骤:S221、利用步骤S13中得到的分类模型初始化RPN网络并对整个RPN网络进行微调,来完成候选窗口提取的任务,从而得到初始的RPN模型;S222、利用步骤S13中得到的分类模型初始化区域卷积网络FRCN并对整个FRCN网络进行微调,同时利用步骤S221中所得到的RPN模型所生成的候选窗口来完成检测的任务,从而得到初始的FRCN模型;S223、利用步骤S222得到的FRCN模型来初始化RPN网络进行微调,但仅微调RPN所特有的网络层,得到一个新的RPN模型;S224、继续微调FRCN模型,但仅微调FRCN模型所特有的网络层,得到一个新的FRCN模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海凌科智能科技有限公司,未经上海凌科智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610541223.8/,转载请声明来源钻瓜专利网。