[发明专利]一种视频流实时行人检测方法在审
申请号: | 201910859779.5 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110555425A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 张春月;史小宏;易典;徐浩 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 31323 上海元好知识产权代理有限公司 | 代理人: | 张妍;周乃鑫 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 分类概率 边界框 二值化 卷积 分类误差 检测结果 快速检测 损失函数 特征提取 行人检测 坐标误差 不敏感 计算量 可信度 视频流 回归 检测 准确率 低维 尺度 输出 融合 | ||
一种视频流实时行人检测方法,对卷积神经网络的输入和权值进行二值化,使用卷积神经网络提取行人的卷积特征,融合卷积神经网络中的多重卷积特征,输出不同尺度的回归边界和分类概率,根据回归边界和分类概率,使用包含了分类误差、边界框坐标误差和边界框内目标可信度误差的损失函数对二值化后的卷积神经网络进行训练,得到最终的检测结果。本发明简化了计算量,实现对目标的实时快速检测,避免了检测时低维特征提取不敏感问题,提高了检测的准确率。
技术领域
本发明涉及深度学习图像检测技术领域,尤其涉及一种基于深度学习的视频流实时行人检测方法。
背景技术
行人检测是指在交通场景下,判断图像或视频信息中是否包含行人,如果包含行人,则用框图标记出行人所在区域。行人跟踪是指在视频第一帧给出所关注行人位置信息的情况下,在后续视频信息中持续稳定的标记出目标行人所处位置。行人的检测和跟踪是智能硬件为人类提供各种服务的重要底层技术之一,有着深远的科研意义和丰富的应用场景。为保持社会稳定、减少公民生命财产损失,海量的监控设备安装在高铁站、购物超市、居住小区中。利用行人检测和跟踪技术分析这些海量视频信息,能够节省大量人力、效率较高。
目前一些汽车生产厂商、大学和研究机构相继开始了行人检测技术的研究。比如,欧洲戴姆勒、德国大众等就发起了旨在研究行人保护方案的PROTECTOR项目,并且已经取得了初步的成效。2004-2005年的SAVE-U项目实现的目标是减少行人和车辆碰撞造成的伤亡数量和事故等级,并在危险状况下驾驶员警告和车辆自动减速试验车辆。作为无人驾驶的先驱技术之一,行人检测系统在近几年也已成为研发热点,它通常整合到碰撞预防系统当中,利用雷达摄像头和感应器来检测行人,并及时减速刹车从而减少事故伤害。沃尔沃、丰田等车企已率先推出先进的行人检测系统,而福特也推出了先进的行人检测系统,能够识别路上的行人并进行动态分析,预测他们是否会闯入驾驶路线中。除了传统汽车公司外,很多互联网公司也在研发行人检测系统,以期实现智能汽车。谷歌最新的行人检测系统只靠摄像机影像来掌握行人动向,但是优化了速度问题。行人检测在智能交通等领域越来越受到重视。
行人检测方法主要分为两大类,基于手工特征提取和基于深度学习,其中:基于手工提取特征的方法有HOG,HOG-LBP,Haar等,主要利用从数据中提取出的相关特征训练SVM和Adaboost等分类器,其中目前最主流的是HOG+SVM,许多文献在HOG+SVM的基础上进行了优化。然而手工提取特征又称为特征工程,有着许多缺点。HOG特征对于遮挡问题效果不好,SIFT特征要求检测目标包含足够多的纹理信息,Haar特征有着计算量大、训练时间很长而且对复杂的目标的描述效果不够好的缺点。
基于深度学习方法,随着近几年深度学习理论的快速发展,取得了很大的进步,特别是检测精度比原有算法有较大的提高。大量文献表明深度学习自我学习的特征可以更好地描述检测目标的特性,避免了复杂的特征提取和数据建模过程。主流的是卷积神经网络CNN,最早用于Mnist手写数字字符数据集上。现在主流的目标检测算法是R-CNN系列,最早的R-CNN算法使用了Selective Search方法从一张图像生成约2000-3000个候选区域,然后通过卷积神经网络在候选区域提取特征并进行判断,之后出现的Fast R-CNN、Faster-RCNN算法都是R-CNN算法的提高。在行人检测领域,Sermanet等人提出了Convnet模型在行人检测数据库获得了很好的效果,Tian等人通过考虑行人和场景的语义属性学习更具有表达能力的特征,Cai等人提出复杂性的级联训练,成功结合了手工提取的特征和卷积神经网络得到的特征,Zhang等人提出了一种使用RPN得到候选区域,然后通过boosted forests分类的行人检测算法。
然而,目前虽然一些检测算法在已经获得了较高准确率,但是在很难以在实际应用中能够使用,其主要原因是深度神经网络庞大的网络结构导致的巨大的计算量难以满足实时的要求。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910859779.5/2.html,转载请声明来源钻瓜专利网。