[发明专利]用于人脸识别的网络构建方法、识别方法及系统有效
申请号: | 201410193260.5 | 申请日: | 2014-05-08 |
公开(公告)号: | CN105095833B | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 李松斌;蒋雨欣;刘鹏;戴琼兴;邓浩江 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/66;G06N3/02 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 网络 构建 方法 系统 | ||
1.一种用于人脸性别识别或年龄估计的深层网络构建方法,所述方法包含:
步骤101)将所有的训练图片划分为若干组;
步骤102)基于卷积神经网络提取一组训练图片的高层特征,进而得到由高层特征向量组成的第一矩阵;同时基于人工神经网络提取同一组训练图片的低层和全局特征,进而得到低层特征向量组成的第二矩阵;
基于提取的第一矩阵、第二矩阵和如下判决公式得到一组性别识别或者年龄估计的结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,hfo表示第一矩阵;lfo表示第二矩阵;针对第一组训练图片上述公式中的第一权值矩阵w1、第二权值矩阵w2、偏置矩阵b和调节权重β的初值采用随机初始化方式获得;针对输入的其余各组的训练图片上述公式中的w1、w2、b和β的值的获取方法为:利用误差反向传播算法计算判决结果o与各组训练图片的实际标签矩阵Y的误差函数J(W,b;β),再通过计算w1、w2、b和β对误差函数J(W,b;β)的梯度进而更新参数w1、w2、b和β的值;
步骤103)再输入一组训练图片,并对再次输入的训练图片重复执行上述步骤102),直至所有的分组均被进行了步骤102)的处理,完成一次训练迭代;
步骤104)将所有的训练图片重新划分为若干组,并对重新划分的各组重复执行上述步骤102)和步骤103),完成再次迭代;
经过若干重新分组和迭代处理,直至最终输出的判决o满足设定的条件时,得到最终的参数w1、w2、b和β的值,完成网络构建;
采用如下公式的误差反向传播算法更新第一权值矩阵w1的值:
其中,(w1)new表示在每一次的误差反向传播时更新后的第一权值矩阵w1的值,(w1)old对应更新前的第一权值矩阵w1的值,Od表示输出层灵敏度矩阵;α表示网络的学习率;
通过如下公式更新第二权值矩阵w2的值:
其中,(w2)new表示在每一次的误差反向传播时更新后的第二权值矩阵w2的值,(w2)old对应更新前的第二权值矩阵w2的值。
2.根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征在于,进行低层特征提取时进一步包含:
步骤102-11)将输入的一组训练图片的每一张训练图片由二维的图结构形式转化为向量的形式,再对向量进行归一化,得到每一张训练图片的原始特征向量;
步骤102-12)将得到的每一张训练图片的原始向量输入人工神经网络,进而得到一组重建特征向量,即得到所述的第二矩阵;其中,所述人工神经网络包含L层,且层与层之间采用全连接方式,每一层的各神经元采用sigmoid函数激活。
3.根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征在于,所述得到一组性别识别或者年龄估计的结果中针对一张训练图片的性别识别或年龄估计过程具体包含:
步骤102-21)当提取的一张训练图片的高层特征向量为Hf维的高层特征向量,且低层特征向量为Lf维的特征向量时,构造一个包含“Hf+Lf”个神经元的联合表决层;
步骤102-22)当用于性别识别时,将构造的联合表决层的各个神经元分别与输出层的两个输出神经元相连,且每个输出神经元基于所述判决公式进行性别判别,输出训练图片为男性或女性的概率;当用于年龄估计时,联合表决层的各个神经元与输出层的S个输出神经元相连,其中每个输出神经元对应一岁。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410193260.5/1.html,转载请声明来源钻瓜专利网。