[发明专利]一种基于改进型LeNet的鲁棒蒙面人脸检测方法在审
申请号: | 201611127956.3 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106778589A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 纪荣嵘;林绍辉;林贤明 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 厦门南强之路专利事务所(普通合伙)35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进型 lenet 蒙面 检测 方法 | ||
技术领域
本发明涉及蒙面人脸检测,尤其是涉及一种基于改进型LeNet的鲁棒蒙面人脸检测方法。
背景技术
随着社会的发展,科学技术的提高,以及多媒体技术的普及,越来越多的人们在网络上上传各种各样的网络视频,其中也包括不少犯罪分子企图利用多媒体渠道,开始传播暴力恐怖视频,这种行为已经在一定程度上影响社会的稳定发展。若能在海量的视频帧中快速且准确地定位出恐怖分子,将极大地减少人力资源和维护社会稳定。
作为一种大尺度视频库的管理的基本需要,准确地检索出拥有恐怖分子的暴恐视频帧对整个社会稳定起到重大的作用。在给定的视频帧中如何准确定义存在恐怖分子,这是一个困难的问题,因为恐怖分子表现形式多种多样。通常情况下,恐怖分子都是蒙面的,所以在本发明中,将恐怖分子认为是具有蒙面特征的人。蒙面人人脸检测作为一种人脸检测的特殊任务,它跟传统的人脸检测技术不同的是面临着更多的挑战。一方面,蒙面人人脸检测包含着传统人脸检测技术无法处理的姿势变化,光照等影响条件。另一方面,蒙面人的脸部是严重遮挡的,大大丢失了原本人脸的正常结构,使得传统算法对于蒙面人人脸检测失效。
目前,大量的人脸检测技术依赖于手动设置的特征,比如:广泛使用的Fisher face[1],基于Haar-like特征的级联分类器[2],基于Gabor-like高维特征的AdaBoost检测器[3]。由于这种手动设置的特征需要大量的训练样本以及蒙面人失去了完整的人脸结构使得手动设计的特征无法准确表征蒙面人人脸结构的,最终使得这些方法无法准确检测到蒙面人人脸。近来,基于模板的(exemplar-based)人脸检测方法[4]表现出了较好的效果,主要因为庞大的模板数据库覆盖了所有可能的人脸视觉变化(visual variations),其中包括遮挡,光照,人脸姿势等变化,但该方法需要大量的模板数据集,且在高度散乱的背景情况下,很容易产生虚警(false alarm)结果。为了减少需要模板的个数,文献[5]提出了一种有效的基于提升的模板人脸检测方法。该方法能够进一步提高人脸检测率,加速检测过程,以及通过判别式训练和有效性的结合模板作为弱分类器的方式,大大地节约内存开销。
近年来,由于深度学习的兴起,使得带有强大的GPU计算能力的卷积神经网络(convolutional neural networks,CNN)在人脸领域也取得了很大的突破,如LFW[6][7][8]。特别地,卷积网络能够通过训练样本自动学习有效的特征表示。在2012年大尺度识别竞赛中(Large Scale Visual Recognition Challenge)中,文献[9]利用深度卷积神经网络取得了突破性的进展。此外,为了进一步处理只有少量的训练样本的情况,文献[10]引入了预训练初始化深度网络的权重,加快网络的收敛以及得到一个较优的局部解。文献[11]提出了LeNet模型,在手写体字符识别中,显示了很好的性能。随着这些深度学习技术的发展,基于深度学习的人脸检测方法成为了可能。
参考文献:
[1]H.J.P.Belhumeur P N,K.D.J.Eigenfaces vs.fisherfaces:Recognition using class specific linear projection.IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.
[2]P.Viola,M.Jones,Rapid object detection using a boosted cascade of simple features.in Proceedings of CVPR,2001.
[3]C.Liu,H.Wechsler,Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition.IEEE Transactions on Image Processing,2002,11(4):467-476.
[4]X.Shen,Z.Lin,J.Brandt,et al.Detecting and aligning faces by image retrieval.in Proceedings of CVPR,2013:3460-3467.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611127956.3/2.html,转载请声明来源钻瓜专利网。