[发明专利]图像处理装置和图像处理方法有效

申请号：	200810130564.1	申请日：	2008-07-07
公开（公告）号：	CN101339609A	公开（公告）日：	2009-01-07
发明（设计）人：	小川要	申请（专利权）人：	索尼株式会社
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	北京东方亿思知识产权代理有限责任公司	代理人：	董方源
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图像处理装置方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及用于检测并识别拍摄图像中包含的面部图像的图像处理装置和图像处理方法，并且更具体地涉及用于检测从输入图像中检测到的面部图像的面部部分(诸如眼睛的中心、内侧角和外侧角，鼻子，鼻子的底端和侧面，嘴，嘴的各端、眉毛以及眉毛头和眉毛尾)的位置的图像处理装置和图像处理方法。

更具体地，本发明涉及用于使用采用了统计学习算法(诸如Adaboost)的检测器检测面部图像的面部部分的位置的图像处理装置和图像处理方法，并且更具体地涉及用于通过使用较少计算量和存储量的面部检测来检测被检测的面部图像的面部部分的位置(诸如眼睛)的图像处理装置和图像处理方法。

背景技术

面部识别技术可广泛应用于人机接口，诸如不会给用户增添负担的个人身份认证系统和性别确定系统。近年来，面部识别技术已经被用于数码相机中针对对象检测或对象识别的自动化相机操作中，例如，自动聚焦(AF)、自动曝光(AE)、自动视角设定或者自动拍照。

在面部识别系统中，例如，执行用于检测面部图像的位置并将被检测的面部图像作为被检测的面部提取出来的面部检测、用于从被检测面部中检测面部主要部分的面部部分检测以及用于识别被检测面部(确定人物)的面部识别。在面部检测中，从输入图像中检测面部图像的尺寸和位置，并且提取被检测的面部图像作为被检测面部。在面部部分检测中，从被检测面部中检测面部部分。面部部分包括眼睛的中心、内侧角和外侧角，鼻子，鼻子的底端和侧面，嘴、嘴的各端、眉毛以及眉毛头和眉毛尾。在基于被检测面部部分的被检测位置执行位置调整和旋转补偿之后，在面部识别中，执行被检测面部的识别(人物的确定)。

已经提出了许多仅仅使用图像信号的浓淡图案从复杂图像场景中检测面部的方法。例如，采用诸如Adaboost的统计学习算法的检测器可用于上述面部检测。

Adaboost被Freund等人于1996年提出作为一种理论，其中通过组合许多“执行稍稍优于随机猜测的弱分类器(也被称为弱学习机)”可以得到“强分类器”。每个弱分类器可以是诸如哈尔基函数(Haar basisfunction)的滤波器并且按照为先前生成的弱分类器所不擅长的分类结果分配权重α的方式而生成。得出每个弱分类器的可信赖度，并且基于所得出的每个弱分类器的可信赖度，执行多数票决(majority vote)。

这里，可以假定在输入图像中包括各种尺寸的面部(参见图9)。因此，有必要切割出各种尺寸的搜索窗口，以便确定在每个切割出的搜索窗口中是否包含面部。

作为处理图像的分辨率和被检测面部的尺寸之间的关系问题的方法，存在固定图像的分辨率的方法(即，针对输入图像中包含的各种尺寸的面部而准备各种面部检测器的方法)以及固定被检测面部的尺寸的方法(即，以不同方式减小输入图像的分辨率以利用具有固定的可检测的面部尺寸的单个面部检测器进行检测的方法)。后者比前者更现实。通常，从通过变换输入图像的比例而得到的每个图像切割出具有与学习样本相同尺寸的窗口(下文中也被称为“搜索窗口”)，以便对不同尺寸的搜索窗口进行搜索。也就是说，因为输入图像中包含的面部的尺寸是不能确定的，所以有必要在每次输入图像的分辨率被改变时使面部检测器对输入图像进行扫描。对于通过改变输入图像的分辨率得到的每个图像，只有尺寸接近图像检测器的固定的可检测的面部尺寸的面部才可以被检测(参见图10)。

然而，例如，由320×240像素构成的输入图像包括大约5000个尺寸的搜索窗口，并且弱鉴别器要花费很长时间来对所有窗口尺寸执行算术运算。因此，已经提出了一些用于提高弱鉴别器的算术运算速度的方法。

例如，公知的是利用矩形特征和称为积分图像的图像快速计算弱假设的方法(参见，例如，美国未审查专利申请公开No.2002/0102024以及Paul Viola编写的“利用具有简单特征的Boosted Cascade进行快速对象检测”(Rapid Object Detection using a Boosted Cascade of Simple Features)(CVPR 2001))。

此外，公开了一种对象检测装置，其中，当进行多数票决时，即使在计算过程中也利用所得到的计算结果将窗口图像确定为非对象，而不等待所有弱鉴别器都单独输出计算结果，然后取消进一步的计算。在这种对象检测装置中，用于取消计算的阈值在学习会话中被学习(参见，例如，日本未审查专利申请公开No.2005-157679)。结果，检测对象过程中的计算量可以明显减少。

发明内容

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于索尼株式会社，未经索尼株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810130564.1/2.html，转载请声明来源钻瓜专利网。

上一篇：用于预防出生缺陷并能改善记忆的药物组合物
下一篇：使用硅氧烷组合物自动涂覆电气绝缘体的方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]图像处理装置和图像处理方法有效

专利文献下载