[发明专利]一种基于无监督学习的行人重识别方法和装置在审
| 申请号: | 202310323821.8 | 申请日: | 2023-03-30 |
| 公开(公告)号: | CN116030502A | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 贺菁菁;徐晓刚;王军;张锦明 | 申请(专利权)人: | 之江实验室;浙江工商大学 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06V10/774;G06V10/762;G06N3/08;G06N3/0464 |
| 代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
| 地址: | 311100 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 监督 学习 行人 识别 方法 装置 | ||
本发明公开的一种基于无监督学习的行人重识别方法和装置,通过无监督行人重识别行人重识别模型前向传播获取样本的特征向量,利用聚类算法给未标注数据集中每个样本分配类别标签并保存每个聚集的中心向量;在每个样本中,基于当前样本的特征向量及类别标签,通过计算该特征向量均值与聚类中心的距离进行有监督的学习,计算新的聚类中心的中心向量,并更新行人重识别神经网络模型的权重参数,继续下一次迭代,直到收敛。本发明实现了在无标签数据集上的伪标签自动生成,增强了模型对于噪声数据的鲁棒性,大大减小了存储器对于内存空间的高额要求;均值采样计算的方法加快了模型参数更新速度,提高训练效率,提升模型应用的泛化能力。
技术领域
本发明涉及机器学习领域,具体涉及一种基于无监督学习的行人重识别方法和装置。
背景技术
在行人重识别(Person Re-identification,re-ID)任务中,利用无标签数据进行无监督学习的方法得到了广泛关注和应用。目前主流的方式是训练一个深度神经网络模型提取行人的特征表示,再利用一个特征存储器将行人特征向量进行实例级的存储,同时使用聚类方法为存储器中的样本生成伪标签,最后利用伪标签进行有监督的分类模型训练,更新存储器中的特征,达到模型参数更新和调整的效果。在无监督行人重识别中,实例级的特征存储器需较大的内存空间,且带有噪声的伪标签对于特征提取和分类模型都会产生消极的影响,导致模型产生过拟合,减弱泛化能力。同时,聚类得到的集群大小不同也使模型在更新过程类之间产生不一致性,当更新小集群中的所有实例时,在大集群中只能更新一小部分实例特性,难以学习到稳定的样本特征,限制了实际应用效果。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出了一种基于无监督学习的行人重识别方法和装置,在存储器中只保存聚类得到的类中的一个实例特征值,在存储器的特征更新阶段,将属于同一个类别的样本特征进行均值采样,用该采样特征更新存储器,其具体技术方案如下:
一种基于无监督学习的行人重识别方法,包括以下步骤:
步骤一,构建并初始化用于提取行人特征向量的深度神经网络;
步骤二,使用所述深度神经网络从无标签的行人数据集中提取得到每个样本的行人特征向量,对行人特征向量进行聚类和距离计算得到若干聚类中心及聚类中心对应的中心向量和类别标签,分配类别标签给每个样本得到样本伪标签,并将聚类中心存入存储器中对存储器进行初始化;
步骤三,利用所述样本伪标签获取到新的行人训练数据集;
步骤四,对步骤三得到的新的行人训练数据集使用均值采样得到最终批量样本来进行所述的深度神经网络的第一次迭代训练,并在训练的每次迭代中更新网络参数和存储器中的聚类中心及对应中心向量;
步骤五,在第一次迭代训练收敛后,进行第二次迭代训练,直到达到网络模型训练的收敛条件。
优选的,所述深度神经网络具体为无监督的行人重识别神经网络模型,包括骨干网络和头部网络,所述骨干网络的参数用预先训练的权重进行初始化,头部网络的参数随机初始化;所述骨干网络的参数包括超参数,以及进行行人重识别神经网络模型训练的第一迭代终止条件参数和第二迭代终止条件参数。
优选的,所述步骤二,具体为:利用初始化后的无监督行人重识别神经网络模型以前向传播方式获取无标签的行人数据集中每个样本的行人特征向量;
对所述行人特征向量进行聚类操作,得到N个类别,N为正整数,每个类别有一个聚类中心,每个聚类中心有一个中心向量和类别标签,并保存聚类中心至存储器中;其中,聚类操作具体采用的聚类算法为DBSCAN,距离计算方式为jaccard;
对无标签的行人数据集中的所有样本按N个类别进行划分,并分配所属类别的标签,得到样本伪标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;浙江工商大学,未经之江实验室;浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310323821.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理系统、方法及设备
- 下一篇:甘氨酸生产废水的处理方法





