[发明专利]一种基于投票算法的半监督行人重识别方法在审
申请号: | 202210645531.0 | 申请日: | 2022-06-09 |
公开(公告)号: | CN114998685A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 林红利;谭小雨;谢康 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/74;G06V10/82;G06V40/10;G06V40/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 投票 算法 监督 行人 识别 方法 | ||
1.一种基于投票算法的半监督行人重识别方法,具体包括有监督部分和无监督部分:有监督部分使用有标签的训练集和其对应的标签对网络进行训练,获得初始的特征提取能力和正确的优化方向。然后,无监督部分包括亲和力矩阵、亲和力矩阵指导的硬样本挖掘、投票损失约束、跨域惩罚四个部分,可以获得人物数据的软伪标签并逐步改善整个训练过程中的特征向量的提取效果。
2.根据权利要求1所述的半监督行人重识别方法有监督部分,其特征在于:在这一部分中网络主要由在ImageNet上预训练的ResNet-50网络搭建的主干网络和由一层全连接层构成的分类网络组成。在有监督学习部分,交叉熵损失函数和三元组损失作为我们使用的损失函数,并由此对网络进行优化。
3.根据权利要求2所述的半监督行人重识别方法有监督部分的三元组损失函数,其特征在于:在训练时,我们采用典型的行人重识别数据构成方式,随机选择一定人物图片对数据生成三元组。因此,在每次训练批次中,我们随机选择NP个人物,每个人物选择NK张图片,即每个训练批次的样本数量为N=NP×NK。所以三元组损失可描述为:
其中代表i个人的第j个锚点图片的特征,对于来说
其中D(·,·)表示两个特征向量的欧氏距离。代表最硬的正(负)样本与锚点样本之间的欧氏距离之差。
4.根据权利要求2所述的半监督行人重识别方法有监督部分的分类网络,其特征在于:分类网络由一层全连接(FC)层构成,生成一个置信分数向量。本发明使用fθ标记从特征到置信分数的映射,即:然后使用Softmax函数对网络的输出进行归一化处理,得到样本属于第c类的置信分数
然后使用典型的交叉熵损失函数进行损失计算
其中yi是有标签图片对的标签,是网络预测的标签。
5.根据权利要求2所述的半监督行人重识别方法有监督部分,使用有监督学习部分的损失函数是
6.根据权利要求1所述的半监督行人重识别方法无监督部分中亲和力矩阵,其特征在于:为了在不同的行人图片间建立人物ID的相关性,引入了亲和力矩阵用来描述标签与标签之间的关系。具体来说,根据投票算法的结果V∈RC×d计算亲和力矩阵A∈RC×C,其中的ai,j元素代表第i张人物图片与第j张人物图片之间的关系
σ代表亲和力矩阵的均值。亲和力矩阵中的第i行表示第j张图片和其他图片之间的相似性。
7.根据权利要求6所述的半监督行人重识别方法无监督部分中亲和力矩阵的投票算法,其特征在于:先使用有监督部分训练的模型对混杂之后的图片进行特征提取,即针对每一幅无标签图片ui得到其特征Φ(θ;ui)。接着将提取到的特征输入到γ个小型网络中进行分类学习。在本发明中使用缓存区V=[v1,v2,…,vC]存储投票结果,其中vi是第i个人的分类向量。在第t个网络进行投票时,vi被更新为
其中,Nt代表第t个投票网络,Φ(θ;ui)代表特征提取网络提取的特征。本发明将每个网络进行加和,确保他们拥有相同的投票权重,这样获得更加鲁棒和稳定的投票结果。值得注意的是大部分身份都是与正确身份无关的,在计算亲和力之前应该将其忽略,否则将引入过多的噪声
其中vi,j即最后的伪软标签结果,T为投票网络的数目,σ是投票结果的平均值。在得到了投票结果后,将要进行亲和力矩阵的计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210645531.0/1.html,转载请声明来源钻瓜专利网。