[发明专利]基于视频的人脸实时检测方法及其装置有效
申请号: | 200910201999.5 | 申请日: | 2009-12-21 |
公开(公告)号: | CN102103694A | 公开(公告)日: | 2011-06-22 |
发明(设计)人: | 罗小伟;林福辉 | 申请(专利权)人: | 展讯通信(上海)有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06T7/60 |
代理公司: | 上海明成云知识产权代理有限公司 31232 | 代理人: | 成春荣;竺云 |
地址: | 201203 上海市浦东张江*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 实时 检测 方法 及其 装置 | ||
技术领域
本发明涉及多媒体领域,特别涉及多媒体领域中的人脸检测技术。
背景技术
近年来,诸如手机,数码照相机等手持设备由于其便携性和含有丰富的多媒体应用而越来越受消费者欢迎。而随着手持设备的越来越普及,人们对作为诸多多媒体应用基础技术的人脸检测的需求也越来越迫切。
所谓人脸检测,指的是在多媒体数据(包括图像和视频等)中检测出所存在的所有人脸的位置,方向、大小以及人脸个数等信息的过程和方法。人脸检测具有重要的意义,可以应用到人脸识别、视频监控以及基于内容的检索等领域,是上述应用中一个必不可少的构成。但人脸是一类具有非常复杂的细节变化的自然结构体,对人脸检测的挑战在于受姿态、外貌、表情、肤色、是否有眼镜等遮挡物以及光学成像环境等诸多条件影响。人脸检测的精度和速度是影响人脸检测走向实际应用的两个关键问题。经过20世纪90年代以来十多年的努力,人脸检测的精度有了大幅提高。但速度还一直没有得到很好解决。直到2001年Viola和Jones基于Adaboost的级联检测算法的提出,人脸检测的速度才得到实质性的提高。相关的文献显示,对于分辨率在384×288大小的图像,700MHz的Intel Pentium III处理器能实现每秒15帧的人脸检测。因此目前已有在台式机等设备上已能实现实时的人脸检测。关于人脸检测技术可参见专利号为“11195611”美国专利。
然而,本发明的发明人发现,由于在现有的人脸检测技术中,对每一帧均是以固定步长搜索全部区域的方式进行检测,因此人脸检测过程的计算复杂度较高。而手持设备大都为嵌入式系统,其计算能力比较差、存储能力较弱,因此很难实现实时的人脸检测,会有延时、停顿和跳跃等现象。
发明内容
本发明的目的在于提供一种基于视频的人脸实时检测方法及其装置,使得人脸检测过程的计算复杂度大幅度降低,而且同样保证检测的准确性。
为解决上述技术问题,本发明的实施方式提供了一种基于视频的人脸实时检测方法,包含以下步骤:
预先将视频图像帧分为全检测帧和预测检测帧两种类型的帧,全检测帧为以固定小步长,采用实时人脸检测算法对图像整个区域进行全搜索检测的图像帧,预测检测帧为基于预测,将图像帧的检测区域分割为人脸候选区域和非人脸区域,对人脸候选区域采用固定小步长,对非人脸区域采用固定大步长搜索检测的图像帧,固定大步长大于固定小步长;
如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔大于预设阈值,则判定当前输入的视频图像帧为全检测帧,以全检测帧的检测方式进行检测;如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔小于或等于预设阈值,则判定当前输入的视频图像帧为预测检测帧,以预测检测帧的检测方式进行检测;
在以全检测帧的检测方式或以预测检测帧的检测方式进行检测后,输出当前视频图像帧内所有检测到的人脸的区域位置;
其中,第一个视频图像帧为全检测帧。
本发明的实施方式还提供了一种基于视频的人脸实时检测装置,包含视频图像帧输入模块、类型判断模块、检测模块和人脸区域输出模块;
视频图像帧输入模块用于将视频图像帧输入到类型判断模块;
类型判断模块用于判断当前输入的视频图像帧的类型,视频图像帧的类型分为全检测帧和预测检测帧两种,全检测帧为以固定小步长,采用实时人脸检测算法对图像整个区域进行全搜索检测的图像帧,预测检测帧为基于预测,将图像帧的检测区域分割为人脸候选区域和非人脸区域,对人脸候选区域采用固定小步长,对非人脸区域采用固定大步长搜索检测的图像帧,固定大步长大于固定小步长;
如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔大于预设阈值,则类型判断模块判定当前输入的视频图像帧为全检测帧;如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔小于或等于预设阈值,则类型判断模块判定当前输入的视频图像帧为预测检测帧;其中,第一个视频图像帧为全检测帧;
检测模块用于根据类型判断模块判断的类型,对当前输入的视频图像帧进行检测;
人脸区域输出模块用于输出检测模块检测到的当前视频图像帧内所有的人脸的区域位置。
本发明实施方式与现有技术相比,主要区别及其效果在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于展讯通信(上海)有限公司,未经展讯通信(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910201999.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:个域网终端协同中切换控制系统和方法
- 下一篇:一种同频和异频关系的配置方法