[发明专利]一种基于AdaBoost的人脸检测分类器构造方法有效
申请号: | 201610308763.1 | 申请日: | 2016-05-10 |
公开(公告)号: | CN106022225B | 公开(公告)日: | 2019-03-05 |
发明(设计)人: | 李建明;李鑫;温峻峰;杜海江;詹心泉;薛柯;王俊舒;林凯泳;陈斌 | 申请(专利权)人: | 中科天网(广东)科技有限公司;中科院广州电子技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州胜沃园专利代理有限公司 44416 | 代理人: | 张帅 |
地址: | 510070 广东省广州市越秀区先*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的目的是提出一种基于AdaBoost的人脸检测分类器构造方法,该方法能够提高人脸检测分类器的训练效率,并基于对训练样本的统计,计算了人脸各器官对最终检测贡献的能力,提高了人脸检测的准确率,从而得到分类效果更好的人脸检测分类器。本发明由下述步骤组成:A:获得人脸样本和非人脸样本;B:对所有样本预处理;C:手工标注各器官的区域;D:统计面部各器官出现规律;E:利用改进的AdaBoost算法训练得到人脸检测弱分类器;F:通过步骤E得出一系列弱分类器,通过将这些弱分类器和面部器官的权重组合得到强分类器。本发明通过持续改变样本的权重来训练一系列的弱分类器,最后将一系列的弱分类器组合形成能够区分人脸和非人脸的强分类器。 | ||
搜索关键词: | 一种 基于 adaboost 检测 分类 构造 方法 | ||
【主权项】:
1.一种基于AdaBoost的人脸检测分类器构造方法,其特征在于由下述步骤组成:A:获得人脸样本和非人脸样本:在监控视频中,截取包含左右以双耳外侧为边界、上下分别以下巴和发际线为边界的人脸图像,以及不包含人脸的非人脸图像;设定人脸图像为正样本,非人脸图像为负样本;正样本与负样本的并集构成训练数据集,表示为A={(x1,y1)......(xn,yn)},其中n为大于1的整数,xi为人脸图像或非人脸图像,若xi为正样本,则yi=1;若xi为负样本,则yi=0;B:对所有样本预处理:将所述人脸图像和非人脸图像均调整为预定大小,并采用直方图均衡技术处理所有人脸和非人脸样本,得到归一化的人脸样本集F={Fi,i=1,2...N}和非人脸样本集B={Bi,i=1,2...M};其中,Fi和Bi分别表示人脸样本和非人脸样本,N和M为整数,代表相应样本集中的样本个数;C:手工标注各器官的区域:人工对人脸样本集F中的每一个样本标注左眼、右眼、鼻子、嘴巴;标注结果以(x,y,w,h)形式的向量进行记录,每个样本Fi对应分别描述左眼、右眼、鼻子、嘴巴的标注区域的四个向量:LEi、REi、Nosei、Mouthi,i=1,2...N;D:统计面部各器官出现规律,具体包括下述D1~D4步骤:D1:令临时变量LEtemp为空,初始化循环控制参数i=0;D2:循环控制参数i=i+1,当i>N时跳转到步骤D3,否则循环执行步骤D2;计算LEi与LEtemp的并集,得到的结果保存在LEtemp中;D3:最终得到的结果保存在LE中,所述LE描述了所有样本的左眼出现区域的并集;D4:参照步骤D1~D3,得到所有样本的右眼出现区域的并集RE、鼻子出现区域的并集Nose、嘴巴出现区域的并集Mouth;D5:在LE区域中,计算所有样本的质心,以质心为矩形区域的中心,逐步扩展宽度w和高度h,当超过数量为θ的人脸样本的左眼区域落在新的区域内时,得到新区域LE′;用相同方法得到新区域RE′、Nose′、Mouth′;定义人脸样本集左眼区域LE′对应的区域权重ωLE=N/θ,右眼区域RE′对应的区域权重ωRE=N/θ、鼻子区域Nose′对应的区域权重ωNose=N/θ、嘴巴区域Mouth′对应的区域权重ωMouth=N/θ;E:利用改进的AdaBoost算法训练得到人脸检测弱分类器:所述弱分类器的训练过程如下:E1:采用所述A步骤得到的训练样本集,并将所述人脸图像和非人脸图像均调整为36*36像素;定义训练样本集中每个正样本对应的初始权重为w1,i=1/2a,负样本对应的初始权重为w1,i=1/2b,所述a和b分别为正样本、负样本的数量,所述i=1...n;定义与样本对应的错分类次数计数器EN1,i=0,所述i=1...n;定义错分类次数计数器归零控制常数CM,所述CM≥3;定义弱分类器总数为T;定义Haar特征为f(x′,y′,w,h),其中x′,y′为在36*36像素的样本中的横坐标和纵坐标,w,h是Haar特征的宽和高;根据上述Haar特征的定义,定义弱分类器为:
其中,x为样本,f为上述定义的Haar特征,θ为弱分类器对应的阈值,p取值±1以决定不等号方向;E2:利用样本训练弱分类器:初始化循环控制变量t=1,弱分类器总数为T=512,错分类次数计数器En1,i归零,控制变量cm_temp=0;当t<T时,循环执行步骤E21~E26:E21:归一化权重
使得所有样本的权重之和为1,同时错分类次数计数器归零控制变量cm_temp=cm_temp+1,记录与样本对应的错分类次数计数器EN1,i在cm_temp≤CM这一阶段内调整的次数;E22:定义弱分类器的分类误差函数为:e=∑iwt,i*|c(xi,f,p,θ)‑yi|,该函数描述了以分类器c(x,f,p,θ)的分类结果,在整个样本集上产生的误差大小;E23:采用最小化误差e的原则,扫描各样本的当前Haar特征(f1,f2...,fn),任取θ为fj到fj+1(j=1,2...n‑1)之间的值,求得使误差e最小的θ值和决定不等号方向的p的值,从而得到ct(x,ft,pt,θt),此时误差记为et;每个弱分类器ct的对应的权重为
其中
E24:根据步骤E23得到的弱分类器ct得到每个样本分类情况,若分类错误,则更新对应的样本错分类次数计数器Ent,i=Ent,i+1,Ent,i记录了样本xi目前被分类器错分类的次数;E25:根据步骤E21~E24得到的各项参数,调整样本的权重
当样本xi被弱分类器ct分类正确,且et小于0.5时权重减小,符合AdaBoost算法所设计的原则,样本正确分类则对应权重减小;当样本xi被弱分类器ct分类错误时,先计算错分类计数器ENt,i与错分类次数计数器归零控制常数CM的比值,再做取整运算,最终取值为0或1;E26:当错分类次数计数器归零控制变量cm_temp等于错分类次数计数器归零控制常数CM时,重新归零错分类次数计数器ENt,i,即令ENt,i=0,令cm‑temp=0,并在下一次循环中重新计算;F:通过步骤E得出了一系列弱分类器,通过将这些弱分类器和面部器官的权重组合得到强分类器,具体包括下述步骤:F1:由步骤E23得到的每个弱分类器ct的权重为
所述
F2:将得到的所有弱分类器与步骤D得到的器官区域进行结合,得到落在LE′区域内的弱分类器集合为CLE={cle1,cle2,...clen1},落在RE′区域内的弱分类器集合为CRE={cre1,cre2,...cren2},落在Nose′区域内的弱分类器集合为CNS={cns1,cns2,...cnsn3},落在Mouth′区域内的弱分类器集合为CMTH={cmth1,cmth2,...cthn4};令CT={c1,c2,...cT},则CLE、CRE、CNs、CMTH均∈CT;F3:由各器官区域权重和弱分类器集合CT得到强分类器c(x):
其中弱分类器ci∈CLE,σi为ci对应的权重;弱分类器cj∈CRE,oj为cj对应的权重;弱分类器cp∈CNS,σp为cp对应的权重;弱分类器cq∈CMTH,σq为cq对应的权重;弱分类器ck∈CT‑CLE‑CRE‑CNS‑CMTH,σk为ck对应的权重;ωLE、ωRE、ωNose、ωMouth分别是人脸样本集左眼区域LE′、右眼区域RE′、人脸样本集鼻子区域Nose′、人脸样本集嘴巴区域Mouth′对应的权重。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科天网(广东)科技有限公司;中科院广州电子技术有限公司,未经中科天网(广东)科技有限公司;中科院广州电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610308763.1/,转载请声明来源钻瓜专利网。