[发明专利]一种基于目标结构关系增强的行人重识别方法在审
申请号: | 202210071827.6 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114529942A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 杨武;李永波;冯欣 | 申请(专利权)人: | 重庆理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06K9/62;G06V10/764 |
代理公司: | 成都东唐智宏专利代理事务所(普通合伙) 51261 | 代理人: | 晏辉 |
地址: | 408000 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 目标 结构 关系 增强 行人 识别 方法 | ||
本发明涉及行人识别技术领域,尤其涉及一种基于目标结构关系增强的行人重识别方法。包括选用ResNet50作为主干网络;在ResNet50的残差堆叠模块中添加结构增强可堆叠注意力模块来强化各层级特征,以通过结构增强因子提升网络学习可区分性特征的能力;使用标签平滑交叉熵损失联和联和三元组损失来训练模型。本发明的结构增强可堆叠注意力模块,能通过局部信息感受全局结构信息来帮助神经网络建立目标结构特征之间的联系,并强化结构信息,以此提炼更加具有区分性的目标结构特征;建模方式建立了结构之间的交互信息,使得结构信息不再独立,加强结构信息与自身表征向量的交互,最终的加强因子更加细腻。
技术领域
本发明涉及行人识别技术领域,尤其涉及一种基于目标结构关系增强的行人重识别方法。
背景技术
行人重识别(Person Re-identification)是一项基础但重要的图像识别任务,其通过在大量候选行人图像中找到与查询目标图像最为接近的目标来实现跨摄像头等场景的目标重识别。该任务的准确识别使得海量视频图像中的行人重识别任务的具体实现成为可能。与人脸识别任务类似,行人重识别旨在研究提取行人目标在不同视角、不同时间以及不同背景情况下的目标的区别性特征嵌入表达,并利用度量函数衡量查询图像与候选目标图像之间特征嵌入的相似性。但由于行人目标图像在跨摄像头场景下呈现出的各方面差异,行人重识别任务面临更大的挑战,如图1中,目标由跨摄像头造成的目标在不同视角下的特征差异、背景差异、目标遮挡情况及行人姿态多样等,都是行人重识别算法需要考虑的重要因素。
传统的行人重识别方法主要采用人工设计的颜色或者梯度等可理解特征来对目标图像进行特征表示。现有文献A(Ojala T, Pietikainen M,Maenpaa T.Multiresolutiongrayscale and rotation invariant texture classifica-tion with local binarypatterns[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2002,24(7):971-987.)利用特定局部二值表示法(LBP)提取特征并进行直方图统计,该直方图被证明是一种非常强大的纹理表示。现有文献B(LOWE D G.Distinctive image features fromscaleinvariant keypoints[J].International Journal of Computer Vision,2004,60(2):91-110)提出了一种尺度不变特征 (SIFT)并且被广泛应用于图像识别领域,如图像检索,图像拼接等任务。文献C(Dalal N,Triggs B.Histograms of oriented gradients forhuman detection[C]//Proc of IEEE Conference on Computer Vision and PatternRecognition.San Diego,USA:IEEE Press,2005:886-893.)提出了一种用于表示局部梯度(HOG)统计表示的特征。然而单一统计特征无法应用于行人重识别这样的复杂图像任务当中,该任务往往涉及环境理解,尺度变换,图像数据质量不一致等困难。研究人员往往需要融合多种底层局部特征与全局特征来对目标图像进行表征,并利用各种强大的分类器去学习最佳分类权重。文献D(Layne R,Hospedales T M,Gong S,et al.Personreidentification by attr ibutes[C]//Proc of B-ritish Machine VisionConference.Britain:BMVA Press,2012:24.1-24.11)认为由于遮挡等原因,自下而上的特征不够鲁棒,提出了中级语义特征与低级特征融合并使用支持向量机进行分类的方法。
尽管研究人员研究并设计了有效的行人目标特征表达,但这类算法仍然受限于显示场景复杂的挑战,镜头转换,姿态变换,甚至服装的改变等困难,从而使得使用手工特征设计的识别算法效果不理想。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210071827.6/2.html,转载请声明来源钻瓜专利网。