[发明专利]一种基于多支流融合模型的行人重识别方法有效
| 申请号: | 202010563309.7 | 申请日: | 2020-06-19 |
| 公开(公告)号: | CN111814845B | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 黄德双;李安东 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/764;G06V10/774;G06N3/08;G06T5/00;G06T7/246;G06V10/82;G06V10/74;G06V40/10 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 支流 融合 模型 行人 识别 方法 | ||
1.一种基于多支流融合模型的行人重识别方法,其特征在于,该方法包括下列步骤:
1)对基准数据集的图片数据随机进行翻转、加噪声、自动裁剪、随机擦除的数据预处理操作;
2)采用ResNet50作为基准网络模型,对基准网络模型进行训练;
3)将步骤1)处理得到的图片数据输入优化及调整后的基准网络模型中,利用多个支流模型的损失函数的融合,联合训练基准网络模型;
4)对提取出的特征分别两两计算欧式距离,并对计算的欧式距离进行排序,在候选集中选取与查询集中目标距离最近的图片作为识别结果,具体内容为:
将预处理得到的训练集图片输入到调整后且去掉全连接层的ResNet-50中进行特征提取,通过主体特征提取器得到特征图后,将特征图进行不同的重组操作,重组后的特征图分别送入各个支流模型,各个支流模型通过总损失函数监督模型训练;
各个支流模型包括五条基于胶囊网络的支流模型,第一条支流模型通过胶囊网络从水平方向提取特征图中不同位置切片的空间关系,第二条支流模型通过胶囊网络从垂直方向提取特征图中不同位置切片的空间关系,第三条支流通过胶囊网络学习所获得特征图中不同通道间的相关关系,第四条支流学习特征图的全局特征,第五条支流获取特征图中相应的相似度度量。
2.根据权利要求1所述的一种基于多支流融合模型的行人重识别方法,其特征在于,第一、二、三、四支流选取在线实例匹配损失作为多分类损失。
3.根据权利要求2所述的一种基于多支流融合模型的行人重识别方法,其特征在于,在线实例匹配损失采用x表示批数据中有行人图像的特征,同时利用查询表存储所有类别的行人特征,在前向传播的过程中,计算出特征图批数据中样本和所有带标签行人的余弦相似度,在反向传播时,若目标对应的为第t类行人,则更新查询表对应的第t行,并进行归一化。
4.根据权利要求3所述的一种基于多支流融合模型的行人重识别方法,其特征在于,特征向量x被视为第j类行人的概率pj为:
其中,为查询表第j列的转置,为查询表第i列的转置,其中τ为概率分布平缓程度,Q和L分别为队列的大小和查询表的行数。
5.根据权利要求2所述的一种基于多支流融合模型的行人重识别方法,其特征在于,第五条支流上采用改进的批量难样本损失获取三元组损失。
6.根据权利要求5所述的一种基于多支流融合模型的行人重识别方法,其特征在于,多支流融合模型通过一个三元组损失函数和四个在线实例匹配损失共同监督训练。
7.根据权利要求6所述的一种基于多支流融合模型的行人重识别方法,其特征在于,网络的总损失函数Ltotal的表达式为:
式中,λr为平衡各支流损失的权重参数,r=1,2,3,4,5;为第q个支流所对应的分类损失,q=1,2,3,4,LT-batch为批量难样本损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010563309.7/1.html,转载请声明来源钻瓜专利网。





