[发明专利]基于像素和通道注意力机制的行人重识别方法有效
申请号: | 201910310802.5 | 申请日: | 2019-04-17 |
公开(公告)号: | CN111832348B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 王敏杰;李现;张加焕;肖江剑 | 申请(专利权)人: | 中国科学院宁波材料技术与工程研究所 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06V10/44;G06V10/56;G06V10/74;G06V10/82;G06K9/62 |
代理公司: | 南京利丰知识产权代理事务所(特殊普通合伙) 32256 | 代理人: | 赵世发;王锋 |
地址: | 315201 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 像素 通道 注意力 机制 行人 识别 方法 | ||
本发明公开了一种基于像素和通道注意力机制的行人重识别方法,包括:根据人物的boundingbox(检索框)来提取行人的全局特征;将行人图片平均分为两部分和三部分,分别提取行人的局部特征;将提取到的人物特征与Gallery中的人物信息进行匹配,找出所需要的人物信息。其利用通道和像素注意力模块来进行特征提取,有效降低背景信息对检索结果的影响;同时,进一步为该神经网络设计了中层监督,在特征提取过程中,使用多损失函数对中层特征信息进行监督,加快网络收敛;本发明所提出的基于通道注意力机制,像素注意力机制和中间层监督的行人重识别网络,能够有效删除人物boudingbox中的冗余信息,使人物信息得到有效聚合,从而显著提高检索精度。
技术领域
本发明涉及一种行人重识别方法,特别涉及一种基于像素和通道注意力机制的行人重识别方法,属于图像处理技术领域。
背景技术
目前,国内国外的各种犯罪行为对社会的持续稳定发展造成了非常大的威胁。在商场、车站、机场和步行街等人流量比较大的场所,遍布着大大小小的监控设备,但是如何从这些监控信息中精确找出我们所需要的人或信息仍然是一个巨大的挑战。特别是在刑侦工作中,民警需要从大量长时间的监控信息中找到犯罪嫌疑人信息,及时了解其情况并进行控制。但是这些监控信息,数量庞大,内容复杂而且监控的视场角较小,快速准确地找出目标人物变得非常困难。尽管目前人脸识别技术已经非常成熟,被广泛应用于各个领域。但是在监控视频中由于相机分辨率和拍摄角度问题,我们无法捕捉到清晰有效的人脸图片,也就无法使用人脸识别技术来检索人物信息。
为了解决在复杂情况下的人物检索问题,行人重识别也称行人再识别技术应运而生。该技术使用计算机来检索人物信息,能够节省大量的人力物力。随着深度学习的发展,基于深度学习的重识别方法也成为行人重识别技术的主流。目前基于深度学习的重识别方法主要分为以下五类:基于表征学习、基于度量学习、基于局部特征、基于视频序列和基于GAN造图的重识别方法。
这些方法被广泛应用于人物重识别研究中,但是这些方法也存在着许多问题。基于表征学习的方法,使用全局特征作为特征向量,在特征提取上会损失很多细节特征,导致检索结果出现误差。基于度量学习的方法是通过神经网络来比较两张图片的相似距离,如何准确计算图片间的相似度仍然是一个需要研究的课题。基于局部特征的方式目前应用比较广泛,该方法将人物图片在垂直方向上分为几个部分,然后分别提取图片的局部特征。但是在划分图片时常常会因为人物的姿态等导致划分不准确的问题,严重影响系统精确度。基于视频序列的重识别技术在如何删除冗余帧的问题上也需要进一步探索。基于GAN的方法生成的图片,目前一般只能作为负样本来使用,失真比较严重。
除了上述方法各自的缺陷之外,相机的低分辨率、遮挡、视角、姿态和光照变化等等因素也会对重识别系统造成许多不良影响。目前基于深度学习的行人重识别方法在提取特征上都使用了池化操作来进行数据降维,但无论是最大池化还是平均池化,对待图片中的各个通道和像素信息都“一视同仁”。特别是在boundingbox(检索框)中,包含了人物信息和背景信息,神经网络无法将两者进行区分,导致特征提取时将背景信息也作为人物特征的一部分,这会对整个重识别系统的精度带来极大的负面影响。如何有效降低背景信息对重识别技术的影响,是一个巨大的挑战。
为了有效降低背景信息对检索结果的影响,本发明提出利用通道和像素注意力模块来进行特征提取。在最大池化和平均池化操作之前,应用通道和像素注意力模块,删除冗余信息,提高图片特征向量的有效性;同时,本发明基于神经网络提取行人的全局和局部特征,还进一步为该神经网络设计了中层监督,在特征提取过程中,使用多损失函数对中层特征信息进行监督,加快网络收敛,提高检索精度。
发明内容
本发明的主要目的在于提供一种基于像素和通道注意力机制的行人重识别方法,以克服现有技术中的不足。
为实现前述发明目的,本发明采用的技术方案包括:
根据人物的boundingbox(检索框)来提取行人的全局特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院宁波材料技术与工程研究所,未经中国科学院宁波材料技术与工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910310802.5/2.html,转载请声明来源钻瓜专利网。