[发明专利]基于群对称理论的行人重识别方法在审
申请号: | 201910377909.1 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110070075A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 张加焕 | 申请(专利权)人: | 中国科学院宁波材料技术与工程研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 南京利丰知识产权代理事务所(特殊普通合伙) 32256 | 代理人: | 赵世发;王锋 |
地址: | 315201 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 损失函数 对称 基于群 残差 输出特征 图像数据 主干网络 构建 网络 检索 球面 读入图像数据 相似度排序 分支网络 前期处理 视频序列 特征提取 整个网络 归一化 求和 放入 加权 查找 图片 | ||
1.一种基于群对称理论的行人重识别方法,其特征在于,包括如下步骤:
步骤一:读入图像数据,进行图像数据前期处理;
步骤二:构建群残差网络ResGroupNet,该群残差网络用于约束输入特征的结构信息;其中,群残差网络结构包括:输入层,主干网络,批量归一化层,群分支网络Group Branch,损失函数Loss;所述群残差网络采用ResNet-50网络作为主干网络;在主干网络的中层引出所述群分支网络,将该主干网络的中层的输出作为所述群分支网络的输入;在所述主干网络的末尾增加第一损失函数Loss1,在所述群分支网络的末尾增加第二损失函数Loss2;将所述第一损失函数Loss1和所述第二损失函数Loss2进行加权求和运算,作为所述群残差网络的总损失函数Loss;
步骤三:将归一化好的图像数据放入构建的群残差网络,进行训练;
步骤四:训练完数据后,进行图像特征提取,将提取的特征进行相似度排序,相似度高的拍在最前面,相似度低的排在后面,得出排序结果;
步骤五:输出特征,根据输出特征检索出需要查找的人物。
2.根据权利要求1所述的基于群对称理论的行人重识别方法,其特征在于,所述的进行图像数据前期处理包括:将读入的图像数据的大小设置为288像素*144像素。
3.根据权利要求1所述的基于群对称理论的行人重识别方法,其特征在于,所述主干网络结构包括五层,分别为:第一层卷积层Conv_1,第二层卷积层Conv2_x,第三层卷积层Conv3_x,第四层卷积层Conv4_x,第五层卷积层Conv5_x;所述分支网络设计在第四层卷积层Conv4_x之后。
4.根据权利要求3所述的基于群对称理论的行人重识别方法,其特征在于,所述群分支网络是基于群对称理论实现的神经网络,利用群对称理论对网络中层的输出信息进行约束或者表示;所述群分支网络的结构包括:输入层,群卷积层GConv1,群卷积层GConv2,群旋转最大池化层GRMP,全连接层FC1,全连接层FC2。
5.根据权利要求4所述的基于群对称理论的行人重识别方法,其特征在于,所述第一损失函数Loss1采用采用球面损失,所述球面损失是基于归一化指数损失函数改进的,所述球面损失定义如下:
给定一个输入特征xi,其对应的标签为yi,则所述归一化指数损失函数可写成如下形式,
其中N是训练样本的个数,C为样本的类个数,zj是完全连接层中第j个神经元的激活函数,全连接层的权重向量为Wj,偏差是bj,令bj=0,则
其中θj是Wj和x之间的角度;用L2归一化方法来正则化Wj和zj,即令||Wj||=1,||x||=1,由此,我们就得到了sphere loss的表达形式,
其中s为尺度因子,取s=14,由此得到所述主干网络的损失函数Loss1=Lsphere。
6.根据权利要求5所述的基于群对称理论的行人重识别方法,其特征在于,所述第二损失函数Loss2采用采用三元损失;所述三元损失定义如下:
三元损失的输入为一个三元组其中是一个锚样本,是一个正样本,即与是同一类,是一个负样本,即与不是同一类;给定两张输入图片x1和x2,它们之间的相似度可以通过它们的空间距离来表征,并且这两张图像之间的距离可以定义为它们的编码之间的差的范数,即
其中,f()为编码函数;因此,三元损失定义如下:
其中函数(·)+代表max(·,0),α是一个默认值为1的超参数,由上式可知,三元损失的目标是缩小和之间的距离,增大和之间的距离,由此得到分支网络的损失函数Loss2=Ltriplet。
7.根据权利要求6所述的基于群对称理论的行人重识别方法,其特征在于,所述群残差网络的总损失函数Loss的定义如下:
Loss=λ1Loss1+λ2Loss2 (14)
其中λ1和λ2为两个超参数,λ1=10,λ2=0.1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院宁波材料技术与工程研究所,未经中国科学院宁波材料技术与工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910377909.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种构建行人检测模型的方法
- 下一篇:用于选取训练用样本的方法和装置