[发明专利]基于深度神经网络的实时人脸识别方法无效
申请号: | 201410023333.6 | 申请日: | 2014-01-17 |
公开(公告)号: | CN103778414A | 公开(公告)日: | 2014-05-07 |
发明(设计)人: | 罗志增;邢健飞;席旭刚;高云园 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于深度神经网络和邻近元分析的实时人脸识别方法。本发明首先利用多样性较好的大规模人脸库训练出一种多层神经网络,其中除最后一层外的每层为非线性层,尾层为线性层;然后利用有监督的邻近元分析的方法在混合人脸库的基础上继续训练得到的网络,使得网络对于人脸图像的理解加深,达到缩短同一个体间人脸图像距离、增大不同个体间人脸图像距离的目的,最后在实际的人脸识别阶段,本发明提出了一种“搜索半径”的概念,在确保识别率的前提下,缩短了识别所需时间,实现了实时的人脸识别。本发明的识别正确率较高,同时,本发明的识别速度较快,适合应用于实时人脸识别任务中。 | ||
搜索关键词: | 基于 深度 神经网络 实时 识别 方法 | ||
【主权项】:
1.基于深度神经网络的实时人脸识别方法,其特征在于该方法包括如下步骤:步骤(1).获取网络训练数据,具体是:选取多样性较好的人脸库作为大规模人脸库;另外,从多个人脸库中选取一部分图像组合成混合人脸库,其中对部分光照变化较强烈的图像进行光照归一化操作,减小光照的影响;采用Viola-Jones人脸检测器检测并剪切大规模人脸库与混合人脸库中图像内人脸部分;将大规模人脸库与混合人脸库中每张图像的像素值按行或列拉伸为一列,组合成行数为图像像素点数,列数为图像张数的矩阵,矩阵除以255,使得数据分布在0-1范围;步骤(2).使用深度神经网络在步骤(1)获取的大规模人脸库中人脸部分图像的基础上以无监督方式训练深度神经网络,具体算法如下;1)初始化每一层网络的权重惩罚因子、权重缩放比例、权重值、偏置值、分组数据大小;权重惩罚因子为控制不让训练得到的网络权重过大,引起过拟合,假设初始化的权重比例为Ws,则有:Ws=sqrt(6)/sqrt(v+h+1)(1)式(1)中,v表示可见层节点数,h表示隐含层节点数;则可得到:W=2*ws*(rand(h,v)-0.5)(2)W′=2*ws*(rand(v,h)-0.5)(3)式(2)(3)中,W、W′分别为可见层、隐含层的初始化权重,rand(m,n)为可生成在(0,1)之间均匀分布随机数组成的m×n矩阵的函数;2)确定网络的损失函数;Autoencoder的目标是是不断改进网络,增强网络对于原始数据的恢复能力,网络的损失函数为:J ( W , b ) = [ 1 m Σ i = 1 m J ( W , b ; x ( i ) , y ( i ) ) ] + λ 2 Σ l = 1 n t - 1 Σ i = 1 s t Σ j = 1 s l + 1 ( W ji ( l ) ) 2 = [ 1 m Σ i = 1 m ( 1 2 | | r W , b ( x ( i ) ) - y ( i ) | | 2 ) ] + λ 2 Σ l = 1 n l - 1 Σ i = 1 s l Σ j = 1 s l + 1 ( W ji ( i ) ) 2 ( 4 ) ]]> 式(4)中,m为数据维数,即可见层节点数,r为经网络重建的数据,W、b分别为权重和偏置,y为实际输入,λ为权重惩罚参数,目的是避免权重过大而引起过拟合,nt为层数,st、st+1为输入层与输出层节点数;3)求取每层网络损失函数对于权重与偏执的偏导数;为了计算方便,使用一种中间变量a、δ1、δ2,对于线性层,有:a=W*y+b(5)δ2=-(y-rW,b(x))(6)δ1=((W′)T*δ2)(7)对于非线性层,假定激活函数为sigmoid,则有:a=1./(1+exp(-(W*y+b)))(8)δ2=-(y-rW,b(x)).*rW,b(x).*(1-rW,b(x))(9)δ1=((W′)T*δ2).*a.*(1-a)(10)目标函数对于可见层、隐含层权重与偏置的偏导数为:∂ J ∂ W = ( 1 m * δ 1 * y ) + λsum ( W ) - - - ( 11 ) ]]>∂ J ∂ b = 1 m * sum ( δ 1 , 2 ) - - - ( 12 ) ]]>∂ J ∂ W ′ = ( 1 m * δ 2 * α T ) + λsum ( W ′ ) - - - ( 13 ) ]]>∂ J ∂ b ′ = 1 m * sum ( δ 2 , 2 ) - - - ( 14 ) ]]> 式(11)(12)(13)(14)中,sum(x)、sum(x,2)分别为求取x所有元素和、求取x所有行之和的函数;求得偏导数后,利用梯度下降法更新权重和偏置;4)每层的权重训练完毕后,将所有网络看作一个整体,利用梯度下降法更新各层权重,进一步提高网络对于数据的恢复能力;步骤(3).以混合人脸库作为输入数据,对步骤(2)得到的深度神经网络进行有监督训练,提高网络对于人脸的认知能力;这里采用邻近元分析的方法来缩短相同个体间人脸图像的距离,增大不同个体间人脸图像的距离,进而提高人脸识别正确率;邻近元分析是一种距离度量学习方法,它用一个平方欧式距离来定义新的转换空间中单一数据域其余数据的距离,函数定义如下:P ij = exp - | | Ax i - Ax j | | 2 Σ k exp - | | Ax i - Ax j | | 2 j ≠ i 0 j = i ( 15 ) ]]> 式(15)中,xi、xj、xk分别为第i、j、k位个体人脸图像所对应的映射数据,A为映射空间,表示为神经网络具体的某层;定义损失函数为f,由下式确定:Σ i Σ j ∈ C i P ij = Σ i P i - - - ( 16 ) ]]> 式(16)中,Ci为个体i所对应的人脸集合;通过求取损失函数f对于每层网络的偏导数
,利用梯度下降法迭代优化网络模型,提高网络对于人脸差异的理解能力;步骤(4).对于人脸映射后的多维数据,使用以下公式求取一个二进制表示数据yab:y αb = 1 x αb ≥ m b 0 x αb < m b - - - ( 17 ) ]]> 式(17)中,xab为第a张人脸图像的第b维分量,mb为所有人脸图像第b维分量的中间值;该公式保证了对于表征图像的每一维分量0与1的均匀分布;识别过程中,根据深度网络表示的待识别图像数据求取该二进制表示数,使用二进制表示数与人脸库中所有图像求取汉明距离,根据所设搜索半径R的大小,使用汉明距离最小的前R张图像作为二次对比图像,一次求出与待识别图像的欧式距离,所得最小的欧式距离与阈值做比较,小于等于阈值则确定为该人脸图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410023333.6/,转载请声明来源钻瓜专利网。