[发明专利]一种基于语义区域测度学习的行人再识别方法有效
| 申请号: | 201710841964.2 | 申请日: | 2017-09-18 |
| 公开(公告)号: | CN107563344B | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 张重;黄美艳;刘爽 | 申请(专利权)人: | 天津师范大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 陈超 |
| 地址: | 300387 *** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 语义 区域 测度 学习 行人 识别 方法 | ||
1.一种基于语义区域测度学习的行人再识别方法,其特征在于,所述方法包括:
步骤S1,将行人再识别两个视角下的每幅训练图像划分为K个子区域并为每个子区域提取特征;
步骤S2,基于两个视角下两幅训练图像不同子区域之间的关系得到三种子区域对类型,所述三种子区域对类型包括类内子区域对、弱类内子区域对和类外子区域对;
步骤S3,基于每个子区域的特征向量和映射矩阵M计算得到三种子区域对特征向量之间的差异,并将其作为三类子区域样本并赋予三类子区域样本对应的标签;
步骤S4,基于三类子区域样本及对应的标签,学习映射矩阵M并利用优化算法求解映射矩阵M;
步骤S5,利用映射矩阵M,计算不同视角下两幅行人图像子区域对之间的距离;
步骤S6,基于子区域间的距离,为每个子区域在与之对应的子区域和与之对应的子区域的邻近子区域中寻找最佳匹配子区域,将每个子区域与其最佳匹配子区域之间的距离作为该子区域的最佳相似度得分;
步骤S7,将两个视角下两幅行人图像所有子区域的最佳相似度得分之和作为两幅行人图像的相似度得分;
步骤S8,在测试阶段,根据步骤S1-S7求得两个视角下任意两幅测试图像的相似度得分,相似度得分最高的两幅测试图像被认为是相似行人图像对,据此得到测试图像的行人再识别结果;
所述步骤S2包括以下步骤:
步骤S21,将不同视角的同一行人的两幅训练图像的对应子区域定义为类内子区域对;
步骤S22,将不同视角的同一行人的两幅训练图像的上下邻近m个非对应子区域定义为弱类内子区域对;
步骤S23,将不同视角的不同行人的两幅训练图像的对应子区域和非对应子区域定义为类外子区域对;
所述步骤S3包括以下步骤:
步骤S31,计算类内子区域对的特征向量在映射空间上的差异,并将其作为正子区域样本,其中,类内子区域对的特征向量在映射空间上的差异ΔI表示为:
其中,和表示任一类内子区域对的特征向量,M为映射矩阵,k用于表示K个子区域中的第k个子区域,1≤k≤K;
步骤S32,计算弱类内子区域对特征向量在映射空间上的差异,并将其作为弱正子区域样本,其中,弱类内子区域对特征向量在映射空间上的差异ΔW表示为:
其中,和表示任一弱类内子区域对的特征向量;
步骤S33,计算类外子区域对特征向量在映射空间上的差异,并将其作为负子区域样本,其中,类外子区域对特征向量在映射空间上的差异ΔE表示为:
其中,和表示任一类外子区域对的特征向量;
所述步骤S4包括以下步骤:
步骤S41,确定最大化互信息目标函数Φ(M);
步骤S42,基于所述最大化互信息目标函数Φ(M),利用贪婪轴旋转法得到映射矩阵M;
所述步骤S41包括以下步骤:
步骤S411,确定最大化互信息目标函数Φ(M),所述最大化互信息目标函数Φ(M)表示为:
其中,I(﹒)是互信息,表示两个随机变量的依赖程度;vk是一个集合,vk∈{ΔI,ΔE},lv∈{1,-1};ek也是一个集合,ek∈{ΔW,ΔE},le∈{2,-1};ε为平衡两种互信息的系数;
步骤S412,根据熵的链式法则,将所述最大化互信息目标函数公式Φ(M)的第一项I(vk;lv)表示为:
其中,H(vk)即H(ΔI,ΔE)表示正子区域样本ΔI和负子区域样本ΔE的联合熵,H(vk|lv)表示所有正、负子区域样本的条件熵,P(lv=1)H(ΔI)表示正子区域样本ΔI的边缘熵,P(lv=-1)H(ΔE)表示负子区域样本ΔE的边缘熵;
步骤S413,假设正、负子区域样本服从高斯分布,利用正、负子区域样本估计H(vk)表示为:
其中,r表示子区域的特征向量投射在映射空间的维数,det表示求取矩阵的行列式,表示所有正、负子区域样本的协方差矩阵;
步骤S414,根据对H(vk)的估计,互信息I(vk;lv)可由正、负子区域样本协方差的行列式表示为:
其中,和分别表示正、负子区域样本的协方差矩阵,μ1和ρ分别表示正、负子区域样本的先验概率;
步骤S415,类似的,将所述最大化互信息目标函数Φ(M)的第二项I(ek;le)表示为:
其中,Σle表示所有弱正子区域样本和负子区域样本的协方差矩阵,表示弱正子区域样本的协方差矩阵,μ2表示弱正子区域样本的先验概率;
步骤S416,将最大化互信息目标函数Φ(M)表示为:
所述步骤S42包括以下步骤:
步骤S421,在t-1次迭代时,用M(t-1)估计M(t),找到一个矩阵Y(t)∈SO(d),其中,SO(d)是d维特殊正交群,使得在第t次迭代时M(t)表示为:
M(t)=Y(t)M(t-1),
其中,矩阵Y(t)用于寻找映射矩阵M优化迭代时的旋转方向;
步骤S422,根据李代数(Lie algebra),将映射矩阵M的最佳旋转方向表示为:
其中,2≤p≤d,p+1≤q≤d,β是步长,γ是搜索最优旋转方向的步数,Bp,q是一个只有第p行第q列的元素为1,其它元素均为0的矩阵,Bq,p是一个只有第q行第p列的元素为1,其它元素均为0的矩阵,ΔΦp,q=[Φ(Yp,qM(t-1))-Φ(M(t-1))]/α,α是一个很小的正数,Yp,q=exp(α(Bp,q-Bq,p));
步骤S423,迭代找到满足下式的最优步数γ*:
将矩阵Y(t)表示为:
得到第t次迭代时的M(t),即映射矩阵M:
M(t)=Y(t)M(t-1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津师范大学,未经天津师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710841964.2/1.html,转载请声明来源钻瓜专利网。





