[发明专利]基于MS-KCF的图像序列中人脸快速稳定检测方法有效
申请号: | 201810124952.2 | 申请日: | 2018-02-07 |
公开(公告)号: | CN108229442B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 李小霞;李旻择;叶远征 | 申请(专利权)人: | 西南科技大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06T7/207 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 621010 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ms kcf 图像 序列 中人 快速 稳定 检测 方法 | ||
本发明提出一种基于MS‑KCF的图像序列中人脸快速稳定的检测方法。针对图像序列中角度变化较大、遮挡较为严重的人脸检测问题,本发明提出融合快速精确的目标检测模型MobileNet‑SSD(MS)和快速跟踪模型核相关滤波(Kernelized Correlation Filters,KCF)的一种新的自动检测—跟踪—检测(Detection‑Tracking‑Detection,DTD)模式,即MS‑KCF人脸检测模型。本方法包括如下步骤:步骤1,搭建MS检测网络;步骤2,利用MS网络对目标进行检测;步骤3,更新跟踪模型,用来预测下一帧人脸目标的位置;步骤4,跟踪数帧以后,再更新MS检测网络,对人脸目标重新检测定位;步骤5,对实验结果进行比较分析。实验表明,MS‑KCF模型既保证了对图像序列中角度变化较大、遮挡较为严重的人脸检测的稳定性,同时还大大提高了检测速度。
技术领域
本发明属于机器视觉的目标检测技术领域,特别涉及一种基于MS-KCF的图像序列中人脸快速稳定检测方法。
背景技术
随着计算机技术的不断发展,计算机性能不断提高,人脸检测技术作为计算机视觉领域中的一个重要分支也取得了巨大的突破,如今,人脸检测在门禁系统、智能监控、智能摄像头等有着广泛的应用。人脸检测也是一种富有挑战性的技术,对于图像序列中角度变化较大、遮挡较为严重的人脸如何实时稳定的检测,已成为应用中亟待解决的问题。目前,利用浅层特征的传统方法已经满足不了需求,因此深层次的卷积神经网络(Convolutional Neural Network,CNN)是如今检测技术研究的重点和热点。
传统的人脸检测方法众多,但都具有以下特点:第一,需要人工选择特征,其过程复杂,目标检测效果的优劣取决于研究人员的先验知识;第二,以窗口区域遍历图像的方式检测目标,在检测过程中有很多冗余窗口,时间复杂度高,并且对图像序列中角度变化较大、遮挡较为严重的人脸检测效果欠佳。
近年来,CNN在目标检测领域中取得巨大突破,成为现如今最先进的目标检测方法。CNN在目标检测上的标志性突破是Ross Girshick等人在2014年提出的R-CNN(Region-based CNN)网络,在VOC 上的测试平均检测精度(mean Average Precision, mAP)是Felzenszwalb等人提出基于HOG的DPM(Deformable Parts Model)目标检测算法的两倍。自从R-CNN出现以后,基于CNN的目标检测在VOC数据集中的表现占有主导地位,主要分为两大类:(1)基于候选区域的目标检测,其特点是具有很高的检测精度,但是速度不能满足应用实时性要求,其中代表作有2016年的R-FCN、2017年的Faster R-CNN、2017年的Mask R-CNN等;(2)基于回归的目标检测,其特点是速度很快,但是检测精度欠佳,代表作有2015年的YOLO(You Only Look Once)和2016年的SSD(Single Shot Multibox Detector)等。Jonathan Huang等人在2016年详细阐述了元结构(SSD、Faster R-CNN和R-FCN)的检测精度与速度之间折中的方法。除此之外,一些级联的人脸检测方法也具有不错的效果,例如,Chen等人在2014年提出的Joint Cascade方法利用人脸检测和人脸的标记点检测进行级联,在传统的人脸检测方法中具有较高的检测效果;Zhang等人在2016年提出的MTCNN网络利用三个卷积网络级联,“从粗到精”的算法结构使得多任务的对人脸进行检测,具有较高的召回率,但训练网络时需要用到三种不同的数据集,较为繁琐;Yang等人在2016年提出的Faceness网络利用鼻子、嘴巴、眼睛、头发、胡子这五个特征来判断所检测目标是否为人脸,具有较高的检测精度,但其不满足实时性准则。深度学习正在向手机等嵌入式设备发展,为了达到实时性需求,对基础网络的参数数量有很高的限制,因此2017年Andrew G. Howard等人提出MobileNet,它以少量的分类精度换取大量的参数减少。MoblieNet 的参数数量是VGG16的1/33,在ImageNet-1000分类的正确率为70.6%,只比VGG16少0.9%。综上所述,目前在目标检测领域中兼顾速度和精度仍然是一大难点。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810124952.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序