[发明专利]一种针对感兴趣区域的反馈式行人检测方法有效
申请号: | 201210009835.4 | 申请日: | 2012-01-13 |
公开(公告)号: | CN102609682A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 顾仁涛;李红梅;纪越峰 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 感兴趣 区域 反馈 行人 检测 方法 | ||
技术领域
本发明涉及智能监控技术领域,特别涉及智能视频监控系统中的行人检测。
背景技术
行人检测是物体检测的重要分支,是近年来计算机视觉领域备受关注的前沿方向和研究热点。它在智能监控系统、驾驶员辅助系统、运动分析、高级人机接口等众多领域拥有广泛的应用前景,作为保障汽车、行人安全的一种主动安全手段,已成为产业界和研究界共同关注的一个研究热点。近年来,通过研究人员不懈的研究,行人检测领域涌现了大量优秀的算法,将行人检测的精度一次又一次地提高,向着实用的方向不断迈进。当前行人检测的研究较之以前已经取得了很大的进步,但是依然没有找到一种可以在实际环境中进行大规模应用的方法。这主要是因为行人检测作为物体检测的一个特例有其特殊性,例如行人的多样性,街道周围的复杂背景等。
从研究的切入点来看,当前的研究方法大致可分为三类:第一类是基于特征的方法。这类方法致力于找到一种特征,能够完美地描述人体,并且尽量不受背景、光照、姿势的影响,在各种条件下都能将行人和背景区分开;第二类是基于多部位的方法。这类方法致力于解决人体的非刚性以及遮挡对外观的影响,将人体的变化分解为各个部位的变化,采取各个击破的方式,分而治之,通过对人体的各个部位的检测来完成对整个人体的检测;第三类是基于多视角的方法,这类方法侧重于解决在不同视角下行人外观上的差异。当前的主流研究方向是从机器学习角度出发,从大量的训练样本中自动抽取特征,建立人体模型,把行人检测问题化为一个模式分类的问题。
尽管行人检测已经取得了很大的突破,但距离真正的大规模实用化依然非常遥远,还有很多问题没有解决,需要我们不懈地努力与探索。主要难点有:1)复杂的背景。由于人类活动范围广泛,生活环境不断改变,因此图片中的背景变化很大,这无形中就给人体检测增加了难度,而且由于在图像中,一般人体只占一少部分,因此背景的细微变化都会对检测有很大的影响;2)人体姿势各异。由于人是有关节的,在图像中人的姿势差异性很大,有站,坐,蹲等等,而且着装也大不相同,有长有短,这些都造成了人体这个类别本身的多变性,造成了对人体建模的困难;3)遮挡问题。一般在图像当中,人体并不是完全暴露出来的,有可能被前面的物体遮挡,或者与他人有部分重叠,这些都造成了人体检测的困难;4)检测速度。人体检测是其他应用的前期和基本步骤,它要为后续工作节约时间,因此对人体检测的速度提出了很高的要求,尽量能够达到实时的要求,否则很难把它应用的实际的系统中;5)尺度问题。我们知道人体有高、有低,距离摄像机的远近,也会造成人体大小变化,会造成在图像或视频中人体的尺度范围变化很大。所以作为人体检测系统应当能够处理尺度问题。只有解决了以上问题,行人检测才能达到令人满意的效果。行人检测的关键是快速、准确地检测到行人。
发明内容
一种针对感兴趣区域反馈式行人检测方法,能够鲁棒地应对变化环境中的行人检测。本发明结合离线行人分类和在线跟踪方法,一方面,离线行人分类结果不仅能为在线行人跟踪提供初始化信息,实现跟踪的自动初始化,而且可以作为在线分类器的训练新样本,进而更新优化在线行人分类器,这样在线跟踪分类器就可以随着目标和背景的变化而得以更新。另一方面,在线行人跟踪的结果作为下一帧离线行人分类的感兴趣区域,从而有效降低检测窗口的扫描范围和特征维数。因此,本发明既能应对环境动态的变化又能反映感兴趣人体区域,不仅能提高行人检测速度和准确性,而且能有效应对变化场景。本发明方法包括以下步骤:
步骤1,正负样本图像特征的提取:采用MIT和INTRA行人数据库作为训练库样本,提取图正负样本的特征向量,其步骤为:1)在每个像素上计算图像的梯度;2)将梯度投影到每个最小单位矩形中,并计算梯度方向;3)在块内对最小单位矩形中的梯度进行归一化处理;4)利用AdaBoost选择大小不同的块结构,将检测窗口中的块中的梯度向量级联形成最后的图像特征向量,其中检测窗口大小将与离线行人分类器的正样本相同;
步骤2,离线行人分类器设计和训练:离线行人分类器采用AdaBoost分类算法选择大小不同的块结构特征向量,将选择的特征向量作为筛选出来的特征作为支持向量机特征输入,训练离线行人分类器;
步骤3,将获取的视频图像帧(原始图像)按照双线性内插法缩放成一系列的待测图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210009835.4/2.html,转载请声明来源钻瓜专利网。