[发明专利]一种基于摄像分头布差异对齐约束的无监督行人重识别方法在审
申请号: | 202110257508.X | 申请日: | 2021-03-09 |
公开(公告)号: | CN113065409A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 贾熹滨;王兴 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 摄像 分头 差异 对齐 约束 监督 行人 识别 方法 | ||
本发明公开了一种基于摄像头分布差异对齐约束的无监督行人重识别方法,通过构建基于源领域和目标领域分布一致性的约束和基于跨摄像头视图差异对齐约束,学习具备可转移性、领域不变性和对跨摄像头视图不变性的特征,从而实现能够适应无监督行人重识别跨摄像头视图的模型。采用计算每个摄像头与整体的相似度得分的均值和标准差,约束摄像头视图差异带来的影响,减少同一个行人在不同摄像头下聚类结果不同的差异;通过两种损失函数,训练一个更健壮稳定的无监督行人重识别网络。利用跨摄像头视图伪标签的不变性的思想,在源领域和目标领域样本分布差异较大,且目标领域存在跨视图的情况下,有效解决无监督行人重识别跨摄像头视图的差异问题。
技术领域
本发明涉无监督行人重识别技术领域,具体涉及一种基于摄像头分布差异对齐约束的无监督行人重识别方法。
背景技术
行人重识别(re-ID)旨在通过给定的探测图像在监视视频中定位目标人员。随着深度学习模型的快速发展,大多数的行人重识别方法集中在有监督学习上,并且在公共数据集已经取得了很高的精准度了。然而,它们需要大量的成对标记的数据跨越每一对相机视图,这限制了大规模应用的可扩展性,在这种大规模应用中,由于注释数据集中的所有图像既昂贵又不可行。为了解决可扩展性问题,无监督行人重识别受到了人们广泛的关注,无监督通过将源域迁移到目标域来学习。但是由于源数据集和目标数据集之间存在着一定的数据偏差,目标域的性能可能会显著下降。针对于这一问题最流行的解决方法是无监督自适应域(UDA)。
当前,UDA在图像分类、目标检测、人脸识别等很多方面有了广泛的应用。UDA的方法主要有三类,第一类是基于聚类的方法保持了较强的性能。通过为未标记的训练样本分配标签,并使用生成的目标域的伪标签来优化网络。另一系列利用对抗性生成模型(GAN网络)作为样式转换器,将源域的行人图像(带有身份注释)转换为目标域以此来学习域不变特征。第三类方法尝试通过计算与参考图像或特征的相似性,为目标域样本优化带有软标签的神经网络。许多UDA方法没有考虑到跨摄像机视图的差异,导致同一个行人在不同的摄像头下获得伪标签是不一样的,导致最终性能受到了一定的影响。因为聚类的无监督行人重识别方法获得很高的排名,本发明也是基于无监督聚类的方法,通过约束跨摄像头视图的差异来,减少摄像图视图的影响,提高模型的最终性能。
发明内容
本发明的目的在于提供一种基于摄像头分布差异对齐约束的无监督行人重识别方法,该方法利用领域自适应和跨摄像头视图差异对齐的思想,通过构建基于源领域和目标领域分布一致性的约束和基于跨摄像头视图不变性约束,学习具备可转移性、领域不变性和对跨视图标签不变性的高层特征,从而在源领域和目标领域样本分布差异较大,且目标领域样本伪标签跨视图不一致的情况下,获得适用于目标领域的无监督行人重识别模型。
为实现上述目的,本发明采用以下技术方案:首先通过源数据输入到卷积神经网络(Convolutional Neural Network,CNN)来获得预训练网络;其次通过将源数据集和目标数据集输入预训练的网络来提取特征,通过DBSCAN聚类的方法,采用k-倒数编码作为距离度量获得伪标签;接下来通过两个损失函数来优化网络,使其在每次的迭代之中能够获得更可靠的伪标签。第一个函数为三元组损失函数,由于预测的伪标签不是真实的标签,不能用身份损失,因此用三元组损失函数来优化网络的训练过程。第二个函数为跨摄像头视图差异损失函数,通过对于网络额外增加一个全连接层(fully connected layers,FC),其全连接层输出的Ps身份数量类别,Ps为源数据集中的行人身份数量,这样子就可以得到目标数据集和源数据集的相似性得分,通过计算不同摄像头的下同一类身份的行人相似性得分差距,来减少摄像头视图的差异。
一种基于摄像头分布差异对齐约束的无监督行人重识别方法,包括以下步骤:
步骤1,从摄像头采集行人数据图片之中,手工标记一小部分作为源数据集,大部分没有标记的图片作为目标数据集。输入有标记的源数据集图片,来对于卷积神经网络进行预训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110257508.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于数字孪生的智能建造方法
- 下一篇:均匀混合药物的妇科给药器