[发明专利]图像处理装置和图像处理方法有效
申请号: | 200810130564.1 | 申请日: | 2008-07-07 |
公开(公告)号: | CN101339609A | 公开(公告)日: | 2009-01-07 |
发明(设计)人: | 小川要 | 申请(专利权)人: | 索尼株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 董方源 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 装置 方法 | ||
技术领域
本发明涉及用于检测并识别拍摄图像中包含的面部图像的图像处理装置和图像处理方法,并且更具体地涉及用于检测从输入图像中检测到的面部图像的面部部分(诸如眼睛的中心、内侧角和外侧角,鼻子,鼻子的底端和侧面,嘴,嘴的各端、眉毛以及眉毛头和眉毛尾)的位置的图像处理装置和图像处理方法。
更具体地,本发明涉及用于使用采用了统计学习算法(诸如Adaboost)的检测器检测面部图像的面部部分的位置的图像处理装置和图像处理方法,并且更具体地涉及用于通过使用较少计算量和存储量的面部检测来检测被检测的面部图像的面部部分的位置(诸如眼睛)的图像处理装置和图像处理方法。
背景技术
面部识别技术可广泛应用于人机接口,诸如不会给用户增添负担的个人身份认证系统和性别确定系统。近年来,面部识别技术已经被用于数码相机中针对对象检测或对象识别的自动化相机操作中,例如,自动聚焦(AF)、自动曝光(AE)、自动视角设定或者自动拍照。
在面部识别系统中,例如,执行用于检测面部图像的位置并将被检测的面部图像作为被检测的面部提取出来的面部检测、用于从被检测面部中检测面部主要部分的面部部分检测以及用于识别被检测面部(确定人物)的面部识别。在面部检测中,从输入图像中检测面部图像的尺寸和位置,并且提取被检测的面部图像作为被检测面部。在面部部分检测中,从被检测面部中检测面部部分。面部部分包括眼睛的中心、内侧角和外侧角,鼻子,鼻子的底端和侧面,嘴、嘴的各端、眉毛以及眉毛头和眉毛尾。在基于被检测面部部分的被检测位置执行位置调整和旋转补偿之后,在面部识 别中,执行被检测面部的识别(人物的确定)。
已经提出了许多仅仅使用图像信号的浓淡图案从复杂图像场景中检测面部的方法。例如,采用诸如Adaboost的统计学习算法的检测器可用于上述面部检测。
Adaboost被Freund等人于1996年提出作为一种理论,其中通过组合许多“执行稍稍优于随机猜测的弱分类器(也被称为弱学习机)”可以得到“强分类器”。每个弱分类器可以是诸如哈尔基函数(Haar basisfunction)的滤波器并且按照为先前生成的弱分类器所不擅长的分类结果分配权重α的方式而生成。得出每个弱分类器的可信赖度,并且基于所得出的每个弱分类器的可信赖度,执行多数票决(majority vote)。
这里,可以假定在输入图像中包括各种尺寸的面部(参见图9)。因此,有必要切割出各种尺寸的搜索窗口,以便确定在每个切割出的搜索窗口中是否包含面部。
作为处理图像的分辨率和被检测面部的尺寸之间的关系问题的方法,存在固定图像的分辨率的方法(即,针对输入图像中包含的各种尺寸的面部而准备各种面部检测器的方法)以及固定被检测面部的尺寸的方法(即,以不同方式减小输入图像的分辨率以利用具有固定的可检测的面部尺寸的单个面部检测器进行检测的方法)。后者比前者更现实。通常,从通过变换输入图像的比例而得到的每个图像切割出具有与学习样本相同尺寸的窗口(下文中也被称为“搜索窗口”),以便对不同尺寸的搜索窗口进行搜索。也就是说,因为输入图像中包含的面部的尺寸是不能确定的,所以有必要在每次输入图像的分辨率被改变时使面部检测器对输入图像进行扫描。对于通过改变输入图像的分辨率得到的每个图像,只有尺寸接近图像检测器的固定的可检测的面部尺寸的面部才可以被检测(参见图10)。
然而,例如,由320×240像素构成的输入图像包括大约5000个尺寸的搜索窗口,并且弱鉴别器要花费很长时间来对所有窗口尺寸执行算术运算。因此,已经提出了一些用于提高弱鉴别器的算术运算速度的方法。
例如,公知的是利用矩形特征和称为积分图像的图像快速计算弱假设 的方法(参见,例如,美国未审查专利申请公开No.2002/0102024以及Paul Viola编写的“利用具有简单特征的Boosted Cascade进行快速对象检测”(Rapid Object Detection using a Boosted Cascade of Simple Features)(CVPR 2001))。
此外,公开了一种对象检测装置,其中,当进行多数票决时,即使在计算过程中也利用所得到的计算结果将窗口图像确定为非对象,而不等待所有弱鉴别器都单独输出计算结果,然后取消进一步的计算。在这种对象检测装置中,用于取消计算的阈值在学习会话中被学习(参见,例如,日本未审查专利申请公开No.2005-157679)。结果,检测对象过程中的计算量可以明显减少。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810130564.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序