[发明专利]基于姿态归一化图像生成的行人重识别方法有效

申请号：	201810224187.1	申请日：	2018-03-19
公开（公告）号：	CN108537136B	公开（公告）日：	2020-11-20
发明（设计）人：	付彦伟;钱学林;薛向阳;王文萱;姜育刚	申请（专利权）人：	复旦大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/08
代理公司：	上海正旦专利代理有限公司 31200	代理人：	陆飞;陆尤
地址：	200433 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于姿态归一化图像生成行人识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于计算机图像识别技术领域，具体为基于姿态归一化图像生成的行人重识别方法。本发明的具体步骤包括：行人平均姿态和属性特征的预测；姿态归一化图像生成模型的构建、训练和测试，生成8张不同姿态的行人图像；行人重识别特征提取网络的构建、训练和测试，得到行人重识别特征；最后行人重识别特征融合，获得待检测行人目标以及所有候选行人目标的特征。本发明方法具有速度快、精确度高、鲁棒性好、泛化能力佳、可扩展性强等优点，非常适用于视频行人监控、视频行人信息检索等实际应用。

技术领域

本发明属于计算机图像识别技术领域，具体涉及基于姿态归一化图像生成的行人重识别方法。

背景技术

行人重识别任务旨在通过两个不相交的摄像头对行人进行识别匹配。行人的外观表现可以因为姿态、光照、遮挡、视角等因素的改变而发生巨大的变化，这也为行人重识别问题带来了严峻的挑战。在这些影响因素中，姿态因素带来的改变最为直接、明显，也显得尤为重要。

一方面，随着深度学习热潮的掀起，越来越多的计算机视觉任务开始使用深度学习方法来解决，包括行人重识别任务。近几年提出的解决行人重识别任务的深度学习方法都包含一个基本的思想就是通过“观看”大量的行人图片来“学习”提取具有识别能力，但是对姿态、视觉变化具有不变性的特征。然而，这些方法都具有一定的局限性。首先，其不具有扩展到大型监控网络的能力。现有的模型方法要求大量的带身份标注的行人训练数据，但是对大型监控网络拍摄的图片数据进行身份标注是一件工程量浩大的事情；其次，其对新的监控网络网不具有很好的泛化性通常地，一个训练好的模型只适用于具有相同参数的监控摄像拍摄的行人图片识别任务，对于新的监控网络，若要保证较高的识别精度，必须对网络参数重新进行微调。

另一方面，假设具有丰富的带标注信息训练样本，现有的深度模型仍然面临各种外界干扰因素（例如姿态）带来的挑战，其在面对存在大量姿态变化的行人图片时，不仅要学习到具有对身份敏感的特征，同时也要学习到对视角不敏感的特征。这是因为一个行人的外观表象是有两部分组成：身份敏感但视角不敏感信息和身份不敏感但视角敏感信息。前者包括一些语义属性，例如性别、衣服风格、衣服颜色、穿戴物等；后者是一个相关信息，例如姿态。现有的方法通常是保留前者信息，移除后者信息，但是组成外观表象的这两部分并不是绝对独立的，比如背包的外观表象会因为姿态的不同而发生改变。

文[1]提出了基于多尺度特征融合的行人重识别方法，通过多尺度的方法提取全局与局部特征，并通过特征融合的方法筛选出最具识别能力的特征。但是该方法对姿态引起的外观表象变化并不具有很好的泛化能力。

文[2]利用部件检测、切割、重组的方法实现部件归一化，并融合原始图片特征和部分重组后的图片特征进行行人重识别。但是该方法并不具有很好的泛化、扩展能力。

文[3]提出使用GAN来生成更多的训练样本，并给予弱标签使其在网络训练中起到约束作用，提升识别精度。但是该方法同样对姿态引起的外观表象变化并不具有很好的泛化能力。

参考资料

[1] X. Qian and Y. Fu and Y. Jiang and T. Xiang and X.Xue. Multi-scale Deep Learning Architectures for Person Re-identification. In ICCV,2017；

[2] C. Su, J. Li, S. Zhang, J. Xing, W. Gao, and Q. Tian. Pose-drivendeep convolutional model for person re-identification. In ICCV, 2017；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于复旦大学，未经复旦大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810224187.1/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于姿态归一化图像生成的行人重识别方法有效

专利文献下载