[发明专利]一种基于RCNN的图像检测和流量统计的算法在审
申请号: | 201711315930.6 | 申请日: | 2017-12-12 |
公开(公告)号: | CN108197530A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 盛斌;张越青;肖佳平;田立武;周旭楚 | 申请(专利权)人: | 嘉兴慧康智能科技有限公司;上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/04 |
代理公司: | 北京华仲龙腾专利代理事务所(普通合伙) 11548 | 代理人: | 李静 |
地址: | 314001 浙江省嘉兴市城南路1539*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流量统计 算法 图像检测 视频 卷积神经网络 仿射变换 特征提取 统计结果 位置方向 物体跟踪 重叠现象 状态判别 时间轴 准确率 卷积 正规化 搜索 图像 转换 改进 统计 | ||
本发明公开了一种基于RCNN的图像检测和流量统计的算法,具体步骤如下:步骤一,利用选择搜索法选取region proposal;步骤二,对每个proposal进行仿射变换正规化,变成227x227 pixel size的图像;步骤三,利用5层卷积2层全连接的卷积神经网络进行特征提取;步骤四,对每个类别训练一个SVM分类器;步骤五,利用物体跟踪的统计结果对出现物体进行状态判别以及状态之间的转换统计,状态包括待定出现、确认出现、待定消失和确认消失,得出流量统计的结果。本发明的方法基于RCNN的处理结果,充分利用视频中时间轴的信息得到了一个适用于普通视频,可以任意位置方向进出的流量统计算法,并可以处理物体重叠现象,达到了较高的准确率,较原算法有了极大的改进。
技术领域
本发明涉及图像检测领域,具体是一种基于RCNN的图像检测和流量统计的算法。
背景技术
图像检测,就是通过图像对感兴趣的特征区域(检测目标)进行提取的过程,其中图像是承载检测目标的载体,检测目标需要事先进行特征提取、归纳,最终通过相应算法分离出来。图像检测方法主要是利用图像的灰度信息对目标进行分割,主要包括基于灰度闽值的日标检测方法和基于边缘信息的目标检测方法。
在RCNN之前,大部分的图像检测算法在很多年间都达到了瓶颈,难以突破,最好的算法也是将多种底层特征和高层语义结合进行图像检测。对于特征的提取,一直以来都是SIFT(D. Lowe. Distinctive image features from scale-invariant keypoints.IJCV, 2004. 1)以及HOG(N. Dalal and B. Triggs. Histograms of orientedgradients for human detection. In CVPR, 2005.)的变形,难以有重大突破。SIFT和HOG都是像素块上的模型进行特征表示,我们可以粗略的把其和大脑皮层中V1层联系到一起,而我们也知道识别发生在高层皮层区,所以对于高层特征的提取和检测就即为重要。
CNN(K. Fukushima. Neocognitron: A self-organizing neural networkmodel for a mechanism of pattern recognition unaffected by shift in position.Biological cybernetics, 36(4):193–202, 1980)由Fukushima受生物学发现的影响提出,虽然中间因SVM崛起且当时计算能力不足而受到压制,但是2012年LeCun(A.Krizhevsky, I. Sutskever, and G. Hinton. ImageNet classification with deepconvolutional neural networks. In NIPS, 2012.)在CNN中使用了max(x; 0)rectifying non-linearities and “dropout” regularization等技巧而使得CNN在ImageNet比赛中表现突出,体现了其极强的特征提取能力,并且具有较好的高层特征提取能力。因此考虑将CNN应用到图像检测领域,经验证,取得了显著成果。RCNN为了克服之前提到的缺点,并充分利用CNN强大的提取特征以及分类的能力,采用了先提取regionproposal,然后利用ROI正规化到指定大小,利用卷积网络进行特征提取,最后利用SVM为每个类别做一个分类器进行分类以确定是否采用某个proposal。但是现有的RCNN有时会有误判,将本来不是object的部分标记;现有的RCNN对于有遮挡的物体无法识别;RCNN可能会对将一些物体认为成我们所需要的object,并且持续的标记。流量统计是对视频中通过的特定物体的数量进行统计,由于视角、检测质量等因素的影响,精确测量流量对于计算机来说是个较困难的任务,目前的利用图像的流量检测算法均是针对特定限制条件下的视频进行处理,比如高角度的监控视频等等。然而监控视频具有分辨率低,获取难度高的缺点,而且即便是高角度视频仍然具有图像重叠等问题,这就为人们的应用带来了困扰。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嘉兴慧康智能科技有限公司;上海交通大学,未经嘉兴慧康智能科技有限公司;上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711315930.6/2.html,转载请声明来源钻瓜专利网。