[发明专利]一种基于K-means聚类和区域推荐网络的行人检测方法及系统有效
申请号: | 201811375081.8 | 申请日: | 2018-11-19 |
公开(公告)号: | CN109492596B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 周希杰;孙伟;马光义 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/762;G06V10/764;G06V10/774;G06V10/766;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王恒静 |
地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 means 区域 推荐 网络 行人 检测 方法 系统 | ||
本发明公开了一种基于K‑means聚类和区域推荐网络的行人检测方法,该方法包括以下步骤:(1)构建特征提取网络,所述特征提取网络为去除inception v1模块中所有最大池化层后的网络;(2)将K‑Means聚类算法加入所述特征提取网络的最后一个DepthConcat中,所述最后一个DepthConcat记为C9,得到检测候选区域;(3)将所述检测候选区域作为RPN网络的输入,得到带有矩形区域的包围框,采用ROI池化层采集所述包围框,并计算所述包围框的特征映射,对包围框进行分类和回归;本发明在增加网络的深度和宽度的同时,加入RPN,使得达到既能对行人进行分类,又能对行人进行具体定位的效果。
技术领域
本发明涉及行人检测方法及系统,具体涉及一种基于K-means聚类和区域推荐网络的行人检测方法及系统。
背景技术
行人检测是确定图像或视频是否包含行人,并使用计算机视觉技术标记行人的具体位置。近年来,深度学习正在迅速改变人工智能的世界,见证了行人检测领域的重大进步,这主要归功于深层网络。传统的深度网络是在原始图像或者卷积层上实现同一尺度的卷积,而这个卷积的尺度一般是3*3或者5*5,虽然尺度越大代表着感受野越大,看到的图片信息越多,获得的特征也越好,但另一方面,大的卷积核会导致计算量的暴增,不利于模型深度的增加,计算性能也会降低。同时同一尺度的卷积意味着只能得到单一的特征,很大程度上影响了网络的检测效果,而“Going Deeper With Convolutions”论文中提出的GoogLeNet网络中的inception模块解决了这些问题。在同一卷积层上实现不同尺度的较小卷积,得到不同尺度下的特征,再将特征结合起来,这样得到的特征更具有代表性,可提高网络检测效果,同时也不会导致计算量的暴增,但此网络却仅仅起到分类作用,却没有对行人进行具体定位。
目前基于区域推荐网络的方法大大提高了检测的准确度,此方法将目标检测任务分为两个子问题:第一阶段,将一个专用的区域提案生成网络嫁接在深度卷积神经网络上,生成高质量的候选框。然后第二阶段,设计一个区域上的子网络来对这些候选框进行分类和细化。Faster R-CNN推荐区域网络RPN的设计相当于是一个sliding window对最后的特征图每一个位置都进行了估计,由此找出anchor上面不同变换的proposal,设计非常经典,代价就是sliding window的代价。Faster R-CNN最近在主流目标检测上显示出了很高的准确度,但为了保证检测精度,所有方法必须将图像的大小调整到足够大,使得耗费大量的时间和资源。
发明内容
发明目的:为了克服现有技术的不足,本发明提供一种基于K-means聚类和区域推荐网络的行人检测方法,该方法可以解决对行人进行定位时,网络检测速度慢准确率低的问题。
技术方案:本发明所述的基于K-means聚类和区域推荐网络的行人检测方法,该方法包括以下步骤:
(1)构建特征提取网络,所述特征提取网络为去除inception v1模块中所有最大池化层后的网络;
(2)将K-Means聚类算法加入所述特征提取网络的最后一个DepthConcat层中,所述最后一个DepthConcat层记为C9,得到检测候选区域;
(3)将所述检测候选区域作为RPN网络的输入,得到带有矩形区域的包围框,采用ROI池化层采集所述包围框,并计算所述包围框的特征映射,对包围框进行分类和回归;
(4)利用大量训练样本训练所述步骤(1)(2)和(3)搭建的模型,得到目标网络结构和目标网络参数以及最终的行人检测网络框架;
(5)采用测试样本对训练好的模型进行实时检测。
优选的,所述步骤(2)中,将K-Means聚类算法加入所述特征提取网络的C9中,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811375081.8/2.html,转载请声明来源钻瓜专利网。