[发明专利]基于视频的人脸实时检测方法及其装置有效

申请号：	200910201999.5	申请日：	2009-12-21
公开（公告）号：	CN102103694A	公开（公告）日：	2011-06-22
发明（设计）人：	罗小伟;林福辉	申请（专利权）人：	展讯通信(上海)有限公司
主分类号：	G06K9/46	分类号：	G06K9/46;G06T7/60
代理公司：	上海明成云知识产权代理有限公司 31232	代理人：	成春荣;竺云
地址：	201203 上海市浦东张江***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于视频实时检测方法及其装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及多媒体领域，特别涉及多媒体领域中的人脸检测技术。

背景技术

近年来，诸如手机，数码照相机等手持设备由于其便携性和含有丰富的多媒体应用而越来越受消费者欢迎。而随着手持设备的越来越普及，人们对作为诸多多媒体应用基础技术的人脸检测的需求也越来越迫切。

所谓人脸检测，指的是在多媒体数据(包括图像和视频等)中检测出所存在的所有人脸的位置，方向、大小以及人脸个数等信息的过程和方法。人脸检测具有重要的意义，可以应用到人脸识别、视频监控以及基于内容的检索等领域，是上述应用中一个必不可少的构成。但人脸是一类具有非常复杂的细节变化的自然结构体，对人脸检测的挑战在于受姿态、外貌、表情、肤色、是否有眼镜等遮挡物以及光学成像环境等诸多条件影响。人脸检测的精度和速度是影响人脸检测走向实际应用的两个关键问题。经过20世纪90年代以来十多年的努力，人脸检测的精度有了大幅提高。但速度还一直没有得到很好解决。直到2001年Viola和Jones基于Adaboost的级联检测算法的提出，人脸检测的速度才得到实质性的提高。相关的文献显示，对于分辨率在384×288大小的图像，700MHz的Intel Pentium III处理器能实现每秒15帧的人脸检测。因此目前已有在台式机等设备上已能实现实时的人脸检测。关于人脸检测技术可参见专利号为“11195611”美国专利。

然而，本发明的发明人发现，由于在现有的人脸检测技术中，对每一帧均是以固定步长搜索全部区域的方式进行检测，因此人脸检测过程的计算复杂度较高。而手持设备大都为嵌入式系统，其计算能力比较差、存储能力较弱，因此很难实现实时的人脸检测，会有延时、停顿和跳跃等现象。

发明内容

本发明的目的在于提供一种基于视频的人脸实时检测方法及其装置，使得人脸检测过程的计算复杂度大幅度降低，而且同样保证检测的准确性。

为解决上述技术问题，本发明的实施方式提供了一种基于视频的人脸实时检测方法，包含以下步骤：

预先将视频图像帧分为全检测帧和预测检测帧两种类型的帧，全检测帧为以固定小步长，采用实时人脸检测算法对图像整个区域进行全搜索检测的图像帧，预测检测帧为基于预测，将图像帧的检测区域分割为人脸候选区域和非人脸区域，对人脸候选区域采用固定小步长，对非人脸区域采用固定大步长搜索检测的图像帧，固定大步长大于固定小步长；

如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔大于预设阈值，则判定当前输入的视频图像帧为全检测帧，以全检测帧的检测方式进行检测；如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔小于或等于预设阈值，则判定当前输入的视频图像帧为预测检测帧，以预测检测帧的检测方式进行检测；

在以全检测帧的检测方式或以预测检测帧的检测方式进行检测后，输出当前视频图像帧内所有检测到的人脸的区域位置；

其中，第一个视频图像帧为全检测帧。

本发明的实施方式还提供了一种基于视频的人脸实时检测装置，包含视频图像帧输入模块、类型判断模块、检测模块和人脸区域输出模块；

视频图像帧输入模块用于将视频图像帧输入到类型判断模块；

类型判断模块用于判断当前输入的视频图像帧的类型，视频图像帧的类型分为全检测帧和预测检测帧两种，全检测帧为以固定小步长，采用实时人脸检测算法对图像整个区域进行全搜索检测的图像帧，预测检测帧为基于预测，将图像帧的检测区域分割为人脸候选区域和非人脸区域，对人脸候选区域采用固定小步长，对非人脸区域采用固定大步长搜索检测的图像帧，固定大步长大于固定小步长；

如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔大于预设阈值，则类型判断模块判定当前输入的视频图像帧为全检测帧；如果当前输入的视频图像帧与之前最近一个全检测帧之间的帧数间隔小于或等于预设阈值，则类型判断模块判定当前输入的视频图像帧为预测检测帧；其中，第一个视频图像帧为全检测帧；

检测模块用于根据类型判断模块判断的类型，对当前输入的视频图像帧进行检测；

人脸区域输出模块用于输出检测模块检测到的当前视频图像帧内所有的人脸的区域位置。

本发明实施方式与现有技术相比，主要区别及其效果在于：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于展讯通信(上海)有限公司，未经展讯通信(上海)有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200910201999.5/2.html，转载请声明来源钻瓜专利网。

上一篇：个域网终端协同中切换控制系统和方法
下一篇：一种同频和异频关系的配置方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于视频的人脸实时检测方法及其装置有效

专利文献下载