[发明专利]一种基于图像的行人检测方法及装置在审
申请号: | 201710648627.1 | 申请日: | 2017-08-01 |
公开(公告)号: | CN107563290A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 高万林;陈治昌;于丽娜;仲贞;张国锋;于丽敏 | 申请(专利权)人: | 中国农业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 王莹,李官 |
地址: | 100193 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 行人 检测 方法 装置 | ||
技术领域
本发明涉及计算机视觉技术领域,具体涉及一种基于图像的行人检测方 法及装置。
背景技术
近年来,以机器学习为主导的人工智能发展迅猛,在众多领域都取得了 重大突破。计算机视觉就是人工智能领域下一个非常重要的研究热点和难点, 在计算机视觉领域下目标的检测又是研究的重点,其中最为活跃的一个研究 方向就是关于行人的检测。行人检测即是将图像中出现的行人从背景中区分 出来并精准定位。但是由于人体姿态各异,衣着变化多样,图像容易受到光 照和环境影响,以及人体部位被遮挡等因素,行人检测一直是计算机视觉领 域研究的难点。在现实生活中,行人检测在许多领域都有广泛应用。如视频 监控领域、智能机器人领域、汽车辅助驾驶和自动驾驶领域,这些领域中行 人检测是必不可少的技术。在社会迈向智能化的道路上,行人检测会发挥越 来越大的作用,然而当前的行人检测方法的准确性却达不到应用要求,所以 针对行人检测的困难研究设计具有鲁棒性方法是非常重要的。
因此,如何有效提高行人检测方法的准确性和检测效率是一个亟待解决 的问题。
发明内容
针对现有技术中的缺陷,本发明实施例提供一种基于图像的行人检测方 法及装置。
第一方面,本发明实施例提供一种基于图像的行人检测方法,所述方法 包括:
接收原始图像,并对所述原始图像进行处理得到所述原始图像的图像特 征图;
提取所述原始图像的通道特征,并对所述通道特征进行处理得到通道深 度特征图;
将所述图像特征图和所述通道深度特征图依次连接,并输入所述图像特 征图和所述通道深度特征图到改进后的区域建议网络RPN模型中,以使所述 改进后的区域建议网络RPN模型输出候选目标区域;
输入所述候选目标区域到图像判别模型中,以使所述图像判别模型输出 定位行人的矩形框,从而输出行人检测结果。
可选的,所述对所述原始图像进行处理得到所述原始图像的图像特征图 具体包括:
使用在图像识别网络ImageNet上预先训练过的图像分类模型VGG16网 络作为主体网络对所述原始图像进行特征提取,经过四层深度卷积神经网络 对所述原始图像进行处理得到所述原始图像的图像特征图。
可选的,所述对所述通道特征进行处理得到通道深度特征图具体包括:
对所述原始图像进行预处理,在所述预处理阶段对所述原始图像进行一 系列的线性和非线性的变换,每个图像经过不同的变换得到一个通道,再输 入所述通道特征到一个三层的卷积神经网络中进行处理得到所述通道深度特 征图。
可选的,所述图像判别模型具体包括:
一个感兴趣区域模型ROI层,两个全连接层,一个逻辑回归层和一个边 框Bbox回归层。
可选的,所述通道具体包括:
颜色空间LUV通道、梯度强度通道和梯度直方图通道。
第二方面,本发明实施例提供一种基于图像的行人检测装置,所述装置 包括:
图像特征图获取模块,用于接收原始图像,并对所述原始图像进行处理 得到所述原始图像的图像特征图;
通道深度特征图获取模块,用于提取所述原始图像的通道特征,并对所 述通道特征进行处理得到通道深度特征图;
候选目标区域输出模块,用于将所述图像特征图和所述通道深度特征图 依次连接,并输入所述图像特征图和所述通道深度特征图到改进后的区域建 议网络RPN模型中,以使所述改进后的区域建议网络RPN模型输出候选目 标区域;
检测结果输出模块,用于输入所述候选目标区域到图像判别模型中,以 使所述图像判别模型输出定位行人的矩形框,从而输出行人检测结果。
可选的,所述图像特征图获取模块具体用于:
使用在图像识别网络ImageNet上预先训练过的图像分类模型VGG16网 络作为主体网络对所述原始图像进行特征提取,经过四层深度卷积神经网络 对所述原始图像进行处理得到所述原始图像的图像特征图。
可选的,所述通道深度特征图获取模块具体用于:
对所述原始图像进行预处理,在所述预处理阶段对所述原始图像进行一 系列的线性和非线性的变换,每个图像经过不同的变换得到一个通道,再输 入所述通道特征到一个三层的卷积神经网络中进行处理得到所述通道深度特 征图。
可选的,所述图像判别模型具体包括:
一个感兴趣区域模型ROI层,两个全连接层,一个逻辑回归层和一个边 框Bbox回归层。
可选的,所述通道具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710648627.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序