[发明专利]一种基于深度学习技术的行人检测方法有效

专利信息
申请号: 201610541223.8 申请日: 2016-07-11
公开(公告)号: CN106203506B 公开(公告)日: 2019-06-21
发明(设计)人: 张祝平;张成;徐平平;戴磊 申请(专利权)人: 上海凌科智能科技有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 李玉平
地址: 200233 上海市徐*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 本发明公开了一种基于深度学习技术的行人检测方法,首先基于迁移学习采用“逐步迁移”的策略训练一个二分类模型来初始化最终模型参数;然后采用当前非常流行高效的Faster RCNN框架并加以改进来完成行人检测工作,其基于CNN特征,不仅可以处理任意尺度的图像,而且检测速度快。相比已公开发明专利,本发明所公开的方法并不需要对网络进行特殊的设计,充分利用了已有的可用数据,采用通用的网络结构依旧可以达到不错的实验效果,充分发挥了深度卷积网络的优势,具有设计简单,鲁棒性较佳,检测准确率高,漏检率低的优点。
搜索关键词: 一种 基于 深度 学习 技术 行人 检测 方法
【主权项】:
1.一种基于深度学习技术的行人检测方法,其特征在于,包括训练阶段和测试阶段;测试阶段,只需要将待测图像输入训练所得的模型,即可得到结果;所述的训练阶段主要包括以下两个步骤:S1、模型初始化步骤;S2、模型训练步骤;S1所述的模型初始化步骤是基于迁移学习采用“逐步迁移”的策略微调(fine‑tuning)实现,包括以下子步骤:S11、准备数据,针对INRIA和ETH数据库,进行数据增强操作来扩充数据集;S12、利用ImageNet模型在INRIA和ETH这两个数据库所组成的混合数据集上进行微调,得到新的分类模型;S13、利用在步骤S12中所获得分类模型,在Caltech数据库上进行微调,得到一个新的分类模型;S2所述的模型训练步骤是基于改进的Faster RCNN框架实现,所述基于改进的Faster RCNN框架包含如下子步骤:S21、准备数据集,考虑到Catlech行人数据是全标注的视频同时正负样本的分布不均衡性质,利用过采样来扩充数据集;S22、修改网络结构,整个网络包括候选窗口网络(Region Proposal Networks,RPN)和快速区域卷积神经网络(Fast Region‑Based Convolutional Neural Networks,FRCN),并利用“交叉优化”策略来训练完成;S22中所述的“交叉优化”策略训练方式包括以下子步骤:S221、利用步骤S13中得到的分类模型初始化RPN网络并对整个RPN网络进行微调,来完成候选窗口提取的任务,从而得到初始的RPN模型;S222、利用步骤S13中得到的分类模型初始化区域卷积网络FRCN并对整个FRCN网络进行微调,同时利用步骤S221中所得到的RPN模型所生成的候选窗口来完成检测的任务,从而得到初始的FRCN模型;S223、利用步骤S222得到的FRCN模型来初始化RPN网络进行微调,但仅微调RPN所特有的网络层,得到一个新的RPN模型;S224、继续微调FRCN模型,但仅微调FRCN模型所特有的网络层,得到一个新的FRCN模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海凌科智能科技有限公司,未经上海凌科智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610541223.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top