[发明专利]复杂场景下的多视角人脸检测方法及其装置有效
申请号: | 201110051942.9 | 申请日: | 2011-03-04 |
公开(公告)号: | CN102136075A | 公开(公告)日: | 2011-07-27 |
发明(设计)人: | 张文聪;谭文明;蔡巍伟;贾永华;胡扬忠;邬伟琪 | 申请(专利权)人: | 杭州海康威视软件有限公司 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 上海明成云知识产权代理有限公司 31232 | 代理人: | 成春荣;竺云 |
地址: | 310012 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 场景 视角 检测 方法 及其 装置 | ||
技术领域
本发明涉及视频监控领域,特别涉及视频监控领域中的人脸检测技术。
背景技术
近年来,由于反恐、国土安全和社会安全的需要,世界上各个国家对安防领域加大了投入,而身份识别正是安防的一个核心问题。随着计算机视觉和模式识别技术的快速发展,基于生物特征识别的身份识别技术得到了迅猛的发展,在很多领域都有了应用,越来越显示出其巨大的商业价值和社会价值。人脸识别作为用户接受度最高、最自然、最直观的可视化生物识别技术,其技术和应用价值正在突显。随着生物特征电子护照等出入境政府项目广泛采用人脸识别,人脸识别技术在公安、航空等行业出现了大规模的应用。
人脸检测作为人脸识别的第一步,其重要意义就不言自明。此外,人脸检测在表情识别、人口统计、人流量统计、视频触发抓拍及智能视频监控的事件报警分析也有着广泛的应用前景。另外,人脸检测的算法理论和实现方法也可以应用到诸如车辆检测、行人检测、人头检测等目标检测中。
人脸检测的目的是为了确定图像或视频中人脸的位置、大小和数量。由于人脸模式的复杂性(脸部肤色的不同、表情的改变、胡须、化妆及饰物遮挡等等)、人脸的各种姿态(人脸与摄像机角度的变化导致)以及周围环境光照的变化(如强烈的侧光所产生的阴阳脸)使得人脸检测技术是一项富有挑战性的研究工作,特别是复杂场景下的多视角人脸检测。复杂场景是指对于人脸所处环境光线变化恶劣、且背景复杂、干扰很多等情况,而多视角人脸是指检测图像中覆盖一个较大的视角范围的人脸表观模式,一般上是指左右偏转90度所形成的180度范围,而且人脸存在上下俯仰和倾斜。
目前最为常用的人脸检测算法就是基于Boosting学习的人脸检测方法,Boosting学习算法的核心思想就是通过迭代挑选出多个具有不同分类能力的弱分类器进行组合形成强分类器,其中分类能力较强的弱分类器具有更大的决策权。最为典型的就是Viola等人提出的基于Haar特征的离散AdaBoost算法,并用这一算法学习Cascade型级联结构的正面人脸检测器,使得正面人脸检测达到了实用效果。
但是复杂场景下的多视角人脸检测的研究相对薄弱,其难度也大得多,目前提出的算法较少,离实际应用还存在一定距离。总的来说,多视角人脸检测算法主要经历了三个阶段,典型代表有:并行级联结构的检测方法、金字塔结构的检测方法和矢量树结构的检测方法。这些多视角人脸检测方法的本质都是基于Boosting学习框架下的一大类方法,其主要区别在于检测器的结构设计、Boosting学习算法的形式和采用的特征方面。
其中,并行级联结构的检测方法是最为直观、简单初级的多视角人脸检测方法,通过为每一个视角的人脸训练出一个对应的级联结构检测器,然后在检测过程中依次利用每个检测器对图像中的人脸进行判断,从而实现多视角人脸检测的功能。其中每个级联结构检测器的训练是独立的,分类器的训练算法采用连续AdaBoost学习算法,采用的特征为Haar特征。由于算法仅仅是对多个单视角人脸检测器的简单联合,没有考虑到不同视角人脸间的相似性,所以在检测过程中每个检测器都要对所有的子窗口进行遍历,而一般情况下绝大多数子窗口是非脸部区域,这样就会在非人脸区域上进行重复遍历,耗费大量时间,从而降低检测速度。
金字塔结构检测方法采用由粗到精的检测策略,利用了不同目标间的相似性,并且将目标进行从上至下的划分,根据此相似性训练出一个类似金字塔结构的多视角检测器,然后在检测过程中将子窗口依次送到金字塔结构的各层分类器进行检测,直到最后一层检测出目标。其中分类器的训练算法采用Float Boost学习算法,采用的特征同样为Haar特征。相比简单并行级联结构的检测方法,该方法考虑到了不同视角人脸间的相似性,但是该方法却未考虑到同类视角人脸间的差异性,因此被父节点判定为人脸的子窗口都要被送到下一层的各个孩子结点当中,直到该层所有节点分类器将其判定为非人脸子窗口时才判为非人脸子窗口,从而在一定程度浪费了过多的计算代价在非人脸子窗口上,因此降低了检测速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视软件有限公司,未经杭州海康威视软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110051942.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种野外设备防盗监测及被盗设备追查的方法及装置
- 下一篇:文本一致性编辑方法