[发明专利]基于群对称理论的行人重识别方法在审

申请号：	201910377909.1	申请日：	2019-05-07
公开（公告）号：	CN110070075A	公开（公告）日：	2019-07-30
发明（设计）人：	张加焕	申请（专利权）人：	中国科学院宁波材料技术与工程研究所
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	南京利丰知识产权代理事务所(特殊普通合伙) 32256	代理人：	赵世发;王锋
地址：	315201 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	损失函数对称基于群残差输出特征图像数据主干网络构建网络检索球面读入图像数据相似度排序分支网络前期处理视频序列特征提取整个网络归一化求和放入加权查找图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于群对称理论的行人重识别方法，其特征在于，包括如下步骤：

步骤一：读入图像数据，进行图像数据前期处理；

步骤二：构建群残差网络ResGroupNet，该群残差网络用于约束输入特征的结构信息；其中，群残差网络结构包括：输入层，主干网络，批量归一化层，群分支网络Group Branch，损失函数Loss；所述群残差网络采用ResNet-50网络作为主干网络；在主干网络的中层引出所述群分支网络，将该主干网络的中层的输出作为所述群分支网络的输入；在所述主干网络的末尾增加第一损失函数Loss1，在所述群分支网络的末尾增加第二损失函数Loss2；将所述第一损失函数Loss1和所述第二损失函数Loss2进行加权求和运算，作为所述群残差网络的总损失函数Loss；

步骤三：将归一化好的图像数据放入构建的群残差网络，进行训练；

步骤四：训练完数据后，进行图像特征提取，将提取的特征进行相似度排序，相似度高的拍在最前面，相似度低的排在后面，得出排序结果；

步骤五：输出特征，根据输出特征检索出需要查找的人物。

2.根据权利要求1所述的基于群对称理论的行人重识别方法，其特征在于，所述的进行图像数据前期处理包括：将读入的图像数据的大小设置为288像素*144像素。

3.根据权利要求1所述的基于群对称理论的行人重识别方法，其特征在于，所述主干网络结构包括五层，分别为：第一层卷积层Conv_1，第二层卷积层Conv2_x，第三层卷积层Conv3_x，第四层卷积层Conv4_x，第五层卷积层Conv5_x；所述分支网络设计在第四层卷积层Conv4_x之后。

4.根据权利要求3所述的基于群对称理论的行人重识别方法，其特征在于，所述群分支网络是基于群对称理论实现的神经网络，利用群对称理论对网络中层的输出信息进行约束或者表示；所述群分支网络的结构包括：输入层，群卷积层GConv1，群卷积层GConv2，群旋转最大池化层GRMP，全连接层FC1，全连接层FC2。

5.根据权利要求4所述的基于群对称理论的行人重识别方法，其特征在于，所述第一损失函数Loss1采用采用球面损失，所述球面损失是基于归一化指数损失函数改进的，所述球面损失定义如下：

给定一个输入特征x_i，其对应的标签为y_i，则所述归一化指数损失函数可写成如下形式，

其中N是训练样本的个数，C为样本的类个数，z_j是完全连接层中第j个神经元的激活函数，全连接层的权重向量为W_j，偏差是b_j，令b_j＝0，则

其中θ_j是W_j和x之间的角度；用L₂归一化方法来正则化W_j和z_j，即令||W_j||＝1，||x||＝1，由此，我们就得到了sphere loss的表达形式，

其中s为尺度因子，取s＝14，由此得到所述主干网络的损失函数Loss1＝L_sphere。

6.根据权利要求5所述的基于群对称理论的行人重识别方法，其特征在于，所述第二损失函数Loss2采用采用三元损失；所述三元损失定义如下：

三元损失的输入为一个三元组其中是一个锚样本，是一个正样本，即与是同一类，是一个负样本，即与不是同一类；给定两张输入图片x₁和x₂，它们之间的相似度可以通过它们的空间距离来表征，并且这两张图像之间的距离可以定义为它们的编码之间的差的范数，即

其中，f()为编码函数；因此，三元损失定义如下：

其中函数(·)₊代表max(·，0)，α是一个默认值为1的超参数，由上式可知，三元损失的目标是缩小和之间的距离，增大和之间的距离，由此得到分支网络的损失函数Loss2＝L_triplet。

7.根据权利要求6所述的基于群对称理论的行人重识别方法，其特征在于，所述群残差网络的总损失函数Loss的定义如下：

Loss＝λ₁Loss1+λ₂Loss2 (14)

其中λ₁和λ₂为两个超参数，λ₁＝10，λ₂＝0.1。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院宁波材料技术与工程研究所，未经中国科学院宁波材料技术与工程研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910377909.1/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于群对称理论的行人重识别方法在审

专利文献下载