[发明专利]行人重识别的方法及装置在审
申请号: | 201811522444.6 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109784166A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 冯维新;董远;白洪亮;熊风烨 | 申请(专利权)人: | 北京飞搜科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100876 北京市海淀区西土城路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全局特征向量 图像 神经网络模型 欧式距离 全局特征 特征向量 图像输入 分类信息 局部特征 输出目标 网络识别 网络使用 网络性能 训练过程 训练网络 人图像 测试 输出 分类 衡量 | ||
本发明实施例提供一种行人重识别的方法及装置,其中方法包括:将获取的若干个行人图像输入至预先训练的神经网络模型,输出各行人图像的特征向量,作为第一全局特征向量;将目标行人图像输入至预先训练的神经网络模型,输出目标行人图像的特征向量,作为第二全局特征向量;计算第二全局特征向量与各第一全局特征向量间的欧式距离,选取欧式距离最近的若干个行人图像作为目标行人图像的行人重识别结果。本发明实施例在训练过程中同时使用分类信息,全局特征和局部特征,使网络性能大为提升,在测试及使用过程中只使用全局特征衡量图像间差异,兼顾了网络使用时对识别速度的要求,同时使用距离损失与分类损失训练网络,提高了网络识别效率。
技术领域
本发明实施例涉及图像识别技术领域,更具体地,涉及行人重识别的方法及装置。
背景技术
在视频帧中,由于很多情景下行人的动作姿态变化较大,遮挡严重,部分行人衣着长相相似难以分辨,以及对行人的检测可能存在位置不准确的情况,使得在实际情景中对行人图像的识别充满困难。
行人重识别:也称作行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。如给定一个行人,检索该行人在多个摄像头监控视频中的图像。目前主流的行人重识别技术主要分为以下三类:
第一类是基于表征学习的行人重识别方法,这种方法将行人重识别问题看成是一个分类问题,即把每个行人的图片当做一个类别,利用分类误差训练网络模型。这种方法网络结构简单,且可以使用大量识别的现成技术,但仅仅使用行人的id信息难以学习出泛化能力足够强的模型,因而重识别的效果一般较差。
第二类是基于度量学习的方法。这种方法目的不再是按照行人的ID把不同行人分成不同的类别,而是在于学习图片间的距离,根据距离判断两张图片是否是同一行人。这种方法从行人图像的相似度入手,准确率比较高,速度也比较快,但不能克服同一个行人在不同图像中位置不一致造成的误识别。
第三类是基于局部特征学习的方法,这种方法训练网络将人体分成几个部分,比较时可以在给定的两张图片间对应部分互相比较,提高了系统的性能,但局部特征的提取不仅在训练过程中需要大量的标注数据,并且速度也比较慢。
发明内容
本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的行人重识别的方法及装置。
第一个方面,本发明实施例提供一种行人重识别的方法,包括:
将获取的若干个行人图像输入至预先训练的神经网络模型,输出各行人图像的特征向量,作为第一全局特征向量;将目标行人图像输入至预先训练的神经网络模型,输出目标行人图像的特征向量,作为第二全局特征向量;
计算所述第二全局特征向量与各所述第一全局特征向量间的欧式距离,选取欧式距离最近的若干个行人图像作为所述目标行人图像的行人重识别结果;
其中,所述神经网络模型具体通过以下步骤训练:
获取行人图像的样本集,所述样本集中的样本预先配置对应的行人ID的标签;将所述样本集中的样本输入至残差网络中,输出第一特征矩阵;根据所述第一特征矩阵分别提取样本的全局特征向量和局部特征向量;
根据所述样本的全局特征向量以及标签,使用交叉熵函数计算分类损失;根据所述样本的全局特征向量获取样本的三元组,根据三元组的全局特征向量和局部特征向量分别计算三元组的全局距离损失和局部距离损失;
根据所述分类损失、三元组的全局距离损失和三元组的局部距离损失优化所述神经网络模型中的参数。
第二个方面,本发明实施例提供一种行人重识别的装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京飞搜科技有限公司,未经北京飞搜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811522444.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序