[发明专利]用于人脸识别的网络构建方法、识别方法及系统有效
申请号: | 201410193260.5 | 申请日: | 2014-05-08 |
公开(公告)号: | CN105095833B | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 李松斌;蒋雨欣;刘鹏;戴琼兴;邓浩江 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/66;G06N3/02 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种用于人脸性别识别或年龄估计的深层网络构建方法,所述方法包含:步骤101)将所有的训练图片划分为若干组;步骤102)基于卷积神经网络提取一组训练图片的高层特征,进而得到由高层特征向量组成的第一矩阵;同时基于人工神经网络提取同一组训练图片的低层和全局特征,进而得到低层特征向量组成的第二矩阵;基于提取的第一矩阵、第二矩阵和定义的判决公式得到一组性别识别或者年龄估计的结果;其中定义的判决公式中的第一权值矩阵w1、第二权值矩阵w2、偏置矩阵b和调节权重β的值利用误差反向传播算法更新,获得这些参数的最终取值,完成网络构建。基于网络构建完成时确定的参数的值确定的判决公式进行待识别人脸的年龄和性别的判决。 | ||
搜索关键词: | 用于 识别 网络 构建 方法 系统 | ||
【主权项】:
1.一种用于人脸性别识别或年龄估计的深层网络构建方法,所述方法包含:步骤101)将所有的训练图片划分为若干组;步骤102)基于卷积神经网络提取一组训练图片的高层特征,进而得到由高层特征向量组成的第一矩阵;同时基于人工神经网络提取同一组训练图片的低层和全局特征,进而得到低层特征向量组成的第二矩阵;基于提取的第一矩阵、第二矩阵和如下判决公式得到一组性别识别或者年龄估计的结果:o=sigm(w1*hfo+β×w2*lfo+b)其中,hfo表示第一矩阵;lfo表示第二矩阵;针对第一组训练图片上述公式中的第一权值矩阵w1、第二权值矩阵w2、偏置矩阵b和调节权重β的初值采用随机初始化方式获得;针对输入的其余各组的训练图片上述公式中的w1、w2、b和β的值的获取方法为:利用误差反向传播算法计算判决结果o与各组训练图片的实际标签矩阵Y的误差函数J(W,b;β),再通过计算w1、w2、b和β对误差函数J(W,b;β)的梯度进而更新参数w1、w2、b和β的值;步骤103)再输入一组训练图片,并对再次输入的训练图片重复执行上述步骤102),直至所有的分组均被进行了步骤102)的处理,完成一次训练迭代;步骤104)将所有的训练图片重新划分为若干组,并对重新划分的各组重复执行上述步骤102)和步骤103),完成再次迭代;经过若干重新分组和迭代处理,直至最终输出的判决o满足设定的条件时,得到最终的参数w1、w2、b和β的值,完成网络构建;采用如下公式的误差反向传播算法更新第一权值矩阵w1的值:
其中,(w1)new表示在每一次的误差反向传播时更新后的第一权值矩阵w1的值,(w1)old对应更新前的第一权值矩阵w1的值,Od表示输出层灵敏度矩阵;α表示网络的学习率;通过如下公式更新第二权值矩阵w2的值:
其中,(w2)new表示在每一次的误差反向传播时更新后的第二权值矩阵w2的值,(w2)old对应更新前的第二权值矩阵w2的值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410193260.5/,转载请声明来源钻瓜专利网。