[发明专利]一种基于判别字典学习的跨视角行人重识别方法有效
申请号: | 201910966029.8 | 申请日: | 2019-10-12 |
公开(公告)号: | CN110826417B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 谢明鸿;颜悦 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V40/10;G06V20/52;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 判别 字典 学习 视角 行人 识别 方法 | ||
1.一种基于判别字典学习的跨视角行人重识别方法,其特征在于:包括如下步骤:
1)确定基于判别字典学习的跨视角行人重识别的总体模型框架;
2)将不同视角的行人图像特征分为特定视角域信息分量和域不变行人外观特征分量,学习一个判别字典算法以创建用于描述域信息分量的域通用字典和用于描述域不变分量的域不变字典;
3)训练字典的判别促进项;
4)根据一种扩展正则项强制不同行人的编码系数保持一定距离,而同一行人的编码系数则尽可能接近;
5)训练编码系数的判别促进项,强制具有相同视角的行人图像的编码系数具有很强的相似性;
6)确定基于判别字典学习的跨视角行人重识别的总体目标函数;
7)对总体目标函数中的要更新的变量进行求解;
8)基于仅有域不变行人外观特征的模型采用欧氏距离设计行人匹配方案;
所述的步骤1)的总体模型框架包括:
用表示两相机视角下的训练样本集,此时需要把鲁棒的特征表示学习和判别式度量学习整合到一个框架中,总体模型框架如公式(1)所示:
式中,表示所有相机下行人图像共享的域字典,表示域特定字典,用于在分离域信息后对行人外观特征进行编码,Za,Zb是字典D上Xa和Xb的域信息的编码系数矩阵,Zta,Ztb是对应于字典Dt的域特定信息的编码系数,Φ(D,Dt,Za,Zb,Zta,Ztb)是数据保真度项,Ψ(D,Dt)是字典的判别促进项,Γ(Za,Zb,Zta,Ztb)是编码系数的判别促进项,是D的第列,而是Dt的第列;
所述的步骤2)的判别字典算法包括:
把数据保真度项Φ(D,Dt,Za,Zb,Zta,Ztb)表示为:
式中,建立a、b两相机视角的域信息,将域信息与不受域影响的行人外观特征分开;
所述的步骤3)的字典判别促进项包括:
提出的字典判别促进项为:
式中,||D||*是对字典D的核范数求解,是结构不相干正则项,α1和α2是两个标量参数,分别代表着||D||*和项的权重信息;
所述的步骤4)的扩展正则项包括:
针对视角a提出以下函数,同时采用同样的方法针对视角b提出类似的函数,此处不再赘述:
式中,{z}+=max{z,0},c是一个任意常数,表示在a相机视角下的第l个行人的第k张图像;表示在b视角下的和a视角第l个行人的第k张图像最不相似的编码系数所对应的第l个行人的第k*张图像,其中k*≠k;表示在b视角下的和a视角第l个行人的第k张图像最相似的编码系数所对应的第l*个行人的第k*张图像,其中l*≠l,而式中的表示它不会导致对行人身份的误判,而表示则意味着使用行人图像特征的编码系数进行行人匹配会导致误识别,在这种情况下,最小化可以促使
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910966029.8/1.html,转载请声明来源钻瓜专利网。