[发明专利]一种基于图像的行人检测方法及装置在审

申请号：	201710648627.1	申请日：	2017-08-01
公开（公告）号：	CN107563290A	公开（公告）日：	2018-01-09
发明（设计）人：	高万林;陈治昌;于丽娜;仲贞;张国锋;于丽敏	申请（专利权）人：	中国农业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32;G06K9/62
代理公司：	北京路浩知识产权代理有限公司11002	代理人：	王莹,李官
地址：	100193 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于图像行人检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及计算机视觉技术领域，具体涉及一种基于图像的行人检测方法及装置。

背景技术

近年来，以机器学习为主导的人工智能发展迅猛，在众多领域都取得了重大突破。计算机视觉就是人工智能领域下一个非常重要的研究热点和难点，在计算机视觉领域下目标的检测又是研究的重点，其中最为活跃的一个研究方向就是关于行人的检测。行人检测即是将图像中出现的行人从背景中区分出来并精准定位。但是由于人体姿态各异，衣着变化多样，图像容易受到光照和环境影响，以及人体部位被遮挡等因素，行人检测一直是计算机视觉领域研究的难点。在现实生活中，行人检测在许多领域都有广泛应用。如视频监控领域、智能机器人领域、汽车辅助驾驶和自动驾驶领域，这些领域中行人检测是必不可少的技术。在社会迈向智能化的道路上，行人检测会发挥越来越大的作用，然而当前的行人检测方法的准确性却达不到应用要求，所以针对行人检测的困难研究设计具有鲁棒性方法是非常重要的。

因此，如何有效提高行人检测方法的准确性和检测效率是一个亟待解决的问题。

发明内容

针对现有技术中的缺陷，本发明实施例提供一种基于图像的行人检测方法及装置。

第一方面，本发明实施例提供一种基于图像的行人检测方法，所述方法包括：

接收原始图像，并对所述原始图像进行处理得到所述原始图像的图像特征图；

提取所述原始图像的通道特征，并对所述通道特征进行处理得到通道深度特征图；

将所述图像特征图和所述通道深度特征图依次连接，并输入所述图像特征图和所述通道深度特征图到改进后的区域建议网络RPN模型中，以使所述改进后的区域建议网络RPN模型输出候选目标区域；

输入所述候选目标区域到图像判别模型中，以使所述图像判别模型输出定位行人的矩形框，从而输出行人检测结果。

可选的，所述对所述原始图像进行处理得到所述原始图像的图像特征图具体包括：

使用在图像识别网络ImageNet上预先训练过的图像分类模型VGG16网络作为主体网络对所述原始图像进行特征提取，经过四层深度卷积神经网络对所述原始图像进行处理得到所述原始图像的图像特征图。

可选的，所述对所述通道特征进行处理得到通道深度特征图具体包括：

对所述原始图像进行预处理，在所述预处理阶段对所述原始图像进行一系列的线性和非线性的变换，每个图像经过不同的变换得到一个通道，再输入所述通道特征到一个三层的卷积神经网络中进行处理得到所述通道深度特征图。