[发明专利]一种商业场景下跨摄像头行人重检索方法有效
| 申请号: | 201910627904.X | 申请日: | 2019-07-12 |
| 公开(公告)号: | CN110390283B | 公开(公告)日: | 2023-01-03 |
| 发明(设计)人: | 张吉昌;郭宝珠;董波 | 申请(专利权)人: | 易诚高科(大连)科技有限公司 |
| 主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/762;G06V10/774 |
| 代理公司: | 大连优路智权专利代理事务所(普通合伙) 21249 | 代理人: | 宋春昕;刘国萃 |
| 地址: | 116000 辽宁省大连市高*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 商业 场景 摄像头 行人 检索 方法 | ||
一种商业场景下跨摄像头行人重检索方法,包括以下步骤:(1)、输入图像;(2)、单目标行人分割;(3)、通道组合;(4)、行人特征提取;(5)、特征比对。本发明的商业场景下跨摄像头行人重检索方法,将单目标行人分割和行人特征提取方法相结合,基于单目标行人分割能有效的去除背景,当多人重叠时候能有效分割出主要目标;通过引入RGBM图像既可以有效利用Mask信息,又能避免去除过多背景信息导致准确率降低;通过在Triplet loss中引入聚类中心,可以有效的提高神经网络收敛速度;该方法有效提取特征实现跨摄像头行人重检索。
技术领域
本发明涉及图像处理技术领域。
背景技术
本领域现阶段行人重识别采用的调整方法包括:
1)基于分块特征的行人重识别技术:由于行人目标框基本处于细长矩形框。因此按垂直方向对图像分块,分别提取特征并融合能够有效的提取行人特征。该方案的代表方法有PCB-net,MGN-net;
2)基于姿态对齐行人重识别技术:姿态对齐行人重识别技术是一种有效的应对形体变化的方法,通过行人关键点和仿射变换可以有效的降低姿态变化带来的特征波动。该方法的关键技术在于人体关键点的检测。
3)基于序列识别的行人重识别技术,由于行人运动有较大的不确定性,不同帧之间差别较大。因此有学者通过连续的多帧提取特征的方法,进行行人重识别。通过连续多帧包含的上下文信息可以有效提取行人的步态,姿态等信息,进一步提高准确率。
以上所有方式各有优劣,整体上各自的问题是:
1)分块特征是一个简单有效的方法,其主要依靠衣服的色彩特征,当行人出现换衣服或者背景颜色过于复杂情况下容易失效;
2)基于姿态对齐技术行人重识别,能够提取行人走路姿态信息。但是该方法复杂在监控系统中难以做到实时,需要行人关键点定位技术,当图像尺寸过小时候容易失效;
3)基于序列识别的行人重识别,有点是有较高的识别准确率,缺点是对数据标准要求非常高,序列数据标注非常困难。而且训练过程计算量大,需要很大的计算资源,网络结构也比较复杂,目前技术条件下很难做到实时。
在商业场景下跨摄像头行人检索需要克服以下几个问题,首先在商业场景下背景复杂,不同行人之间会出现交严重的遮挡现象,目标检测出来的行人包围框可能有多个行人出现,行人分割难以将主要人物分离出来,提取行人特征困难。
发明内容
为了解决商业场景下跨摄像头行人检索存在的上述问题,本发明提供了一种商业场景下跨摄像头行人重检索方法。
本发明为实现上述目的所采用的技术方案是:一种商业场景下跨摄像头行人重检索方法,包括以下步骤:
(1)、输入图像;
(2)、单目标行人分割,包括以下步骤:
b)数据准备:在coco数据集中,通过每个目标的包围框[x,y,w,h]分别在原图和mask图上裁剪图像,保证每个图像中只包含一个人物,分别得到图像imagei和图像maski,其中x为矩形框左上角横坐标,y为矩形框左上角纵坐标,w为矩形框宽,h为矩形框高度;
b)网络选型;
c)建立损失函数,对网络进行训练,损失函数如下:
其中:loss为最终损失函数;λ为尺度参数;
(3)、通道组合,将mask作为一个通道添加到原图上,每个人的图像由RGB图像到RGBM图像,然后送入神经网络中并提取特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易诚高科(大连)科技有限公司,未经易诚高科(大连)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910627904.X/2.html,转载请声明来源钻瓜专利网。





