[发明专利]基于深度学习的快速行人检测方法在审
申请号: | 201810001077.9 | 申请日: | 2018-01-02 |
公开(公告)号: | CN108229390A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 孙君凤;许宏吉;刘爱玲;房桦;刘琛 | 申请(专利权)人: | 济南中维世纪科技有限公司;山东大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 张贵宾 |
地址: | 250101 山东省济南市济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人检测 构建 行人数据 多通道视频 标注信息 数据集 监控视频图像 预处理 标准数据 测试图像 复杂背景 监控视频 快速检测 网络模型 训练模型 异常事件 拼接 微调 光照 采集 图像 测试 场景 检测 学习 发现 分析 | ||
1.一种基于深度学习的快速行人检测方法,其特征在于:包括以下步骤:
(1)构建带有标注信息的行人数据集:
采集不同场景下的监控视频图像,构建行人检测标准数据集,并对数据集进行扩充,包含图像及其标注信息;
(2)利用构建的行人数据集对网络模型预训练,生成适用于行人检测的模型:
利用步骤一中准备好的数据集对预训练模型进行微调,训练为适用于所构建数据集的行人检测模型;
(3)对训练好的模型进行多通道视频快速行人检测的测试:
基于多通道视频拼接方法,对待测试图像进行预处理,输入训练好的模型进行检测,得到目标的位置信息。
2.根据权利要求1所述的基于深度学习的快速行人检测方法,其特征在于:
步骤(1)中:构建带有标注信息的标准行人数据集,主要包括以下三部分:
1-1、采集不同场景下的行人画面图像;包含多种行人姿态、多种场景、多种光照影响以及一天中不同时段的视频图像,使得构造的数据集能够有效覆盖场景的多样性;
1-2、对采集到的数据集进行有效的扩充,通过图像镜像、角度旋转、尺寸缩放、添加随机噪声的方法;
1-3、对扩充后的数据集图像生成对应的的标注及标签信息,标注信息即样本中目标的位置信息,标签信息即样本中目标所属类别,类别为人标注为1或非人标注为-1。
3.根据权利要求1所述的基于深度学习的快速行人检测方法,其特征在于:
步骤(2)中:利用构建的行人数据集训练基于Faster R-CNN的模型:
通过上述构建的标注数据集,采用Faster R-CNN网络结构对预训练模型进行微调,训练适用于行人检测的模型;Faster R-CNN网络包括用于产生候选区域的RPN卷积神经网络和用于目标判别的fast R-CNN卷积神经网络构成。
4.根据权利要求1所述的基于深度学习的快速行人检测方法,其特征在于:
步骤(3)中:对训练好的模型进行多通道视频快速行人检测的测试,主要包含以下三部分:
3-1、采用多通道视频帧拼接方法生成待测试图像
通过将多通道的监控视频图像进行拼接,组合成一幅大尺寸的图像,然后将拼接后的图像输入到训练好的模型中进行检测,相当于多个通道的视频帧同时进行检测,能够有效节省待检测视频的检测时间;
3-2、 利用视频帧预处理方法减少周围环境的影响
在检测过程中,图像预处理的主要目的是消除图像中的冗余信息,滤除干扰、噪声,增强有关信息的可检测性,从而提高后续特征提取和检测的可靠性;
可用的图像处理方法主要包括以下方法:直方图均衡化、归一化、Gamma校正;
3-3、将经过预处理过的拼接帧输入到训练好的模型中进行行人检测,输出行人位置信息及对应的置信度。
5.根据权利要求3所述的基于深度学习的快速行人检测方法,其特征在于:
步骤(2)中:
利用已有的ImageNet模型在构建的数据集上进行微调,得到适用于行人检测的新的分类模型,主要步骤如下:
2-1采用ImageNet模型的ZF-Net网络进行预训练,首先对该网络模型的全连接层进行修改,输出种类为两类,即行人及非行人;
2-2在构建的样本集上预训练模型,Faster R-CNN包括用于提取候选区域的微调RPN网络以及用于检测目标的Fast R-CNN网络;RPN网络对输入的包含行人的图像进行处理,生成行人粗选区域;而Fast R-CNN网络对这些行人粗选区域进行进一步的判别,输出行人最终的位置信息;RPN网络和Fast RCNN网络能够共享特征,减少了提取候选区域的时间,缩短了目标检测的时间;
使用预训练的方法主要是为了得到一个良好的网络初始化值,以避免后续的训练中陷入局部最小值,同时还能够加快网络的收敛速度;后续使用构建的样本集对网络进行微调,以确保参数更加适合当前的样本集,提高在数据集上的检测率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南中维世纪科技有限公司;山东大学,未经济南中维世纪科技有限公司;山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810001077.9/1.html,转载请声明来源钻瓜专利网。