[发明专利]人脸识别深度学习模型训练方法、装置、设备及存储介质在审
申请号: | 202211727442.7 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115953820A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 杨战波;黄泽元;蒋召 | 申请(专利权)人: | 北京龙智数科科技服务有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82;G06N3/045;G06N3/0464;G06N3/08 |
代理公司: | 北京嘉科知识产权代理事务所(特殊普通合伙) 11687 | 代理人: | 杨超 |
地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 深度 学习 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种人脸识别深度学习模型训练方法,其特征在于,包括:
将人脸样本图像输入到预定的双支路基础单元,利用所述双支路基础单元中的第一支路和第二支路分别提取第一特征图和第二特征图,将所述第一特征图和所述第二特征图进行拼接,得到变换特征图;
将所述变换特征图输入到骨干网络,对所述骨干网络中预设的目标阶段输出的特征图进行处理,得到每个所述目标阶段对应的特征向量,将所述特征向量进行聚合,得到目标特征向量;
确定所述目标特征向量与各个人脸类别的类中心之间的夹角,并根据所述人脸样本图像对应人脸类别的样本数及最大类别样本数确定加性间隔参数,将所述夹角及所述加性间隔参数输入到预设的损失函数中计算损失值;
利用所述损失值反向更新人脸识别深度学习模型的参数,以便对所述人脸识别深度学习模型进行训练。
2.根据权利要求1所述的方法,其特征在于,利用所述双支路基础单元中的第一支路提取第一特征图,包括:
将所述人脸样本图像输入到第一卷积层中进行卷积处理,并对卷积处理后的特征图进行批归一化和激活函数处理,得到第一输出特征图;
将所述第一输出特征图输入到第二卷积层中进行卷积处理,并对卷积处理后的特征图进行批归一化和激活函数处理,得到第二输出特征图,将所述第二输出特征图作为所述第一特征图。
3.根据权利要求1所述的方法,其特征在于,利用所述双支路基础单元中的第二支路提取第二特征图,包括:
将所述人脸样本图像的高和宽,按照偶数列和奇数列分别重新组合,将重新组合后的图像在通道维度上进行拼接;
将拼接后的图像输入到第三卷积层中进行卷积处理,并对卷积处理后的特征图进行批归一化和激活函数处理,得到所述第二特征图。
4.根据权利要求1所述的方法,其特征在于,所述对所述骨干网络中预设的目标阶段输出的特征图进行处理,得到每个所述目标阶段对应的特征向量,包括:
在所述骨干网络中依次执行第一阶段、第二阶段、第三阶段和第四阶段处理,其中将所述第二阶段、第三阶段和第四阶段作为目标阶段;
将所述第二阶段、第三阶段和第四阶段输出的特征图分别依次利用全局平均池化层、全连接层、批归一化层和激活函数层进行处理,得到所述第二阶段、第三阶段和第四阶段分别对应的特征向量。
5.根据权利要求4所述的方法,其特征在于,所述将所述特征向量进行聚合,得到目标特征向量,包括:
将所述第二阶段、第三阶段和第四阶段分别对应的特征向量进行聚合,并将聚合后的特征向量输入到全连接层,并使用批归一化对所述全连接层输出的特征向量做归一化处理,得到所述目标特征向量。
6.根据权利要求1所述的方法,其特征在于,所述根据所述人脸样本图像对应人脸类别的样本数及最大类别样本数确定加性间隔参数,包括采用以下公式计算加性间隔参数:
其中,m表示加性间隔参数,m0表示margin上界,nyi表示第yi类别的样本数,nmax表示最大类别样本数。
7.根据权利要求6所述的方法,其特征在于,所述将所述夹角及所述加性间隔参数输入到预设的损失函数中计算损失值,包括采用以下损失函数计算损失值:
其中,xi表示第i个人脸样本的目标特征向量,θj表示第i个人脸样本的目标特征向量xi与第j类别的类中心Wj的夹角,θyi表示xi与对应类中心Wyi的夹角,m表示加性间隔参数,s表示特征缩放参数,N表示所有类别数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京龙智数科科技服务有限公司,未经北京龙智数科科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211727442.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:像素控制装置和显示设备
- 下一篇:一种低VOC聚丙烯材料及其制备方法