[发明专利]一种基于稀疏表示的增量人脸识别方法有效
申请号: | 201510345789.9 | 申请日: | 2015-07-21 |
公开(公告)号: | CN104978569B | 公开(公告)日: | 2018-04-03 |
发明(设计)人: | 杨若瑜;叶君健 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 江苏圣典律师事务所32237 | 代理人: | 胡建华 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于稀疏表示的增量人脸识别方法,包括通过人脸检测获取人脸关键点信息,确定人脸局部块位置,分别提取每个局部块HOG特征,根据稀疏表示分类方法为每个局部块构造一个局部人脸字典,在测试时根据测试图片动态选择部件特征生成全局人脸字典。对于一张测试人脸图片,提取局部块特征,在对应局部人脸字典上进行测试,根据得到的局部结果判断人脸部件的好坏,根据好坏结果挑选出合格部件,将训练集中合格部件特征连接构建全局人脸字典,构建测试图片全局人脸特征,得到的全局结果为最终结果。在增量处理上将整个训练集根据类别分成N个互斥的子集,在每个子集上都进行处理得到判别结果,在所有子集中进行竞争得到最终的结果。 | ||
搜索关键词: | 一种 基于 稀疏 表示 增量 识别 方法 | ||
【主权项】:
一种基于稀疏表示的增量人脸识别方法,包括以下步骤:步骤1,输入训练人脸图片集,将同一个人的训练图片划分为同一个类别,并用数字标注类别信息,之后将包含类别信息的训练集平均分成N个子集,同一个人的训练图片属于同一类别,N为大于1的自然数;步骤2,对每个子集中的每张人脸图片,根据人脸检测方法定位人脸关键点,根据人脸关键点确定人脸部件位置,之后提取每个人脸部件的特征构造人脸部件字典;步骤3,输入测试图片,根据人脸检测方法得到测试图片的人脸关键点信息,提取人脸部件特征,在每个子集上都进行步骤4~5操作;步骤4,对测试图片中每一个人脸部件特征,在对应的人脸部件字典上得到分类结果,根据得到的分类结果,通过计算每个人脸部件的重建误差判断测试图片中的各个人脸部件受人脸变化影响程度,选择最小的两个重建误差为标准判断剩下的部件是否为合格部件;步骤5,根据剩余的合格,连接训练人脸图片集中对应的人脸部件特征,组成全局人脸字典,从而得到测试图片在这一子集上的最终结果;步骤6,根据每个子集的结果,进行一次竞争,从中得到具有最小重建误差的分类结果作为最后的分类判别结果从而完成人脸识别;步骤7,对于新加入的样本,选择一个子集,之后按照步骤2所述提取新样本的四个部件特征,加入所选择的子集中的人脸部件字典中;步骤1中,将训练人脸图片根据类别划分成N个子集,同一个人的训练图片属于同一个类别,不同人的训练图片属于不同类别,每个子集拥有的类别数量相同,并且同一人的人脸图片只出现在一个子集中;步骤2中,所述根据人脸检测方法定位人脸关键点包括对人脸图片中的关键点进行定位,得到双眼,鼻子,嘴巴共四个人脸部件周围的点作为关键点,所述根据人脸关键点确定人脸部件位置包括根据双眼,鼻子,嘴巴周围关键点的位置确定一个矩形区域来包含人脸部件,所述提取每个人脸部件的特征构造人脸部件字典包括提取人脸部件对应的矩形区域内的方向梯度直方图特征作为人脸部件的特征,为每个人脸部件都构造一个局部字典,构造局部字典的方法如下:将人脸部件特征分为K个类,K为大于1的自然数,设第i类有Ni个样本,fi,j为第i个类第j个样本的特征,为一个行向量,i取值为1~K,j取值范围1~Ni,则局部字典D定义如下:D=[f1,1;f1,N1;…;fm,1;fm,Nm;…;fK,1;fK,NK];步骤3中,对一张测试图片进行人脸关键点定位和人脸部件定位,得到这张测试图片中人脸的双眼、鼻子、嘴巴四个人脸部件特征,然后在训练集划分出来的N个子集的每个子集中都进行一次步骤4~5的分类判别;步骤4包括:对于训练人脸图片集得到的四个人脸部件对应的矩形区域局部块,每一个都进行如下操作:设定局部块得到的方向梯度直方图特征为y,根据局部字典D得到一个稀疏系数x,x满足:y=Dx,通过最小化稀疏系数x绝对值迭代得到稀疏系数满足||y‑Dx||1<ε,其中ε=0.05,局部字典D有N项,稀疏系数x是一个N维向量,其中xi,j表示x对应局部字典D中第i个类的第j个项的系数;用Di表示D中属于类i的字典部分,对于不属于类i的部分设为0,属于类i的fi,j部分为保留原值,用γi(x)表示稀疏系数x中对应局部字典D中属于类i的项的系数值,对于不属于类i的项,在γi(x)中的值都为0,Di=[0;0;…;fi,1;…;fi,Ni;…;0;0],γi(x)=[0;0;…;xi,1;…;xi,Ni;0…;0;0],最后分类结果r为具有最小重建误差的类:r=argmini||y‑γi(x)*D||1,重建误差residual表示如下:residual=||y‑γr(x)*Dr||1,对于每个子集中的每个人脸部件都能得到一个分类结果r以及重建误差residual,对于其中任一子集,令四个人脸部件得到的重建误差为residual1、residual2、residual3和residual4,residualmin1和residualmin2分别代表residual1、residual2、residual3和residual4中最小和第二小的值,residuali代表residual1、residual2、residual3和residual4中的第i个结果;如果residuali<residualmin1+residualmin2,则判定第i个部件是合格部件,否则将第i个部件丢弃,此时记录这个子集中的合格部件个数为Ngood,在此子集下全局人脸特征构造如下:令fpart1,fpart2,fpart3,fpart4分别代表从四个人脸部件得到的局部特征,均为行向量形式,fwholeface代表全局特征,则从1到4遍历i,如果第i个部件为合格部件,则将fparti加入到全局特征中,即fwholeface=[fwholefacefparti],遍历完成之后得到全局人脸特征,在此子集下全局人脸字典构造如下:令该子集的四个人脸部件的局部字典分别为D1,D2,D3,D4,每个局部字典的构造都如下所示:D=[f1;f2;f3;…;fn],fi为一个行向量,若该子集中有n个训练样本,则D中一共有n个对应的行向量,令Dwholeface代表全局字典,则从1到4遍历i,如果第i个部件为合格部件,则将Di加入到全局字典Dwholeface中,Dwholeface中第k行数据定义为fDwholefacek,Di中第k行数据为fDik,则将Di加入全局字典之后,全局字典中第k行数据变为fwholefacek=[fDwholefacekfDik],从而得到这个子集上的全局人脸字典;步骤5包括,在每个子集上,根据得到的合格部件结果,在四个局部字典的基础上得到全局人脸字典,之后得到在此子集上测试人脸全局特征,具体过程如下:令ftest1,ftest2,ftest3,ftest4分别为测试人脸的四个局部人脸部件特征,ftestwholeface为测试人脸的全局特征,从1到4遍历i,如果在这个子集中第i个部件为合格部件,则ftestwholeface=[ftestwholefaceftesti],得到测试人脸全局特征之后根据全局人脸字典得到此子集的全局人脸分类结果,判断测试人脸属于类别r,以及对应的重建误差residual:residual=||ftestwholeface‑γr(x)*Dwholeface||1,||..||1为1范式符号,即求绝对值,γr(x)代表稀疏系数中属于类别r的部分,Dwholeface代表全局字典,γr(x)*Dwholeface代表将稀疏系数中属于类别r的部分与全局字典中对应的属于类别r的项Dr相乘得到的结果,如下所示:Dr=[0;0;…;fr,1;…;fr,Nr;…;0;0],γr(x)=[0;0;…;xr,1;…;xr,Nr;0…;0;0],γr(x)*Dwholeface=Σi=1Nrfr,i*xr,i;]]>步骤6中包括根据每个子集的分类结果,重建误差residual以及合格部件数目Ngood,比较每个子集的residual/|Ngood|,并将此值最小的子集的分类结果作为最终结果;包括步骤7,对于新加入的训练样本,首先判断它是否是子集中已存在的类别,如果是,则提取它的人脸部件特征之后加入到对应的子集中,否则随机选择一个子集加入它的人脸部件特征,之后更新对应子集中的人脸部件字典,具体包括:对于一个新加入的训练样本,首先提取它的双眼,鼻子,嘴巴共四个人脸部件的特征,之后寻找这个新加入样本加入的子集,如果是已有的类别,则加入到包含这个类别的子集中,否则随机选择一个子集加入,之后将这四个人脸部件特征加入这个子集中对应的人脸部件字典中,更新人脸部件字典,其它子集不做任何更新处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510345789.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种智能动态高清视频检测系统
- 下一篇:前方车辆检测方法