[发明专利]基于非对称映射半耦合字典对的低分辨率行人重学习方法有效
申请号: | 201910324340.2 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110032984B | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 荆晓远;马飞;訾璐;黄鹤;姚永芳;李娟娟 | 申请(专利权)人: | 广东石油化工学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 11401 北京金智普华知识产权代理有限公司 | 代理人: | 杨采良 |
地址: | 525000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 映射 低分辨率视频 字典 非对称 分辨率视频 半监督 分辨率 学习 视频 高分辨率视频 低分辨率 高分辨率 视频对象 特征转化 投影矩阵 有效解决 有效应用 重新识别 准确率 场景 清晰 | ||
1.一种基于非对称映射半耦合字典对学习的低分辨率视频行人重学习方法,其特征在于,所述基于非对称映射半耦合字典对学习的低分辨率视频行人重学习方法包括:
步骤一、对高分辨率行人视频和低分辨率行人视频分别进行时空特征提取;
步骤二、设计视频重构误差项、半耦合映射项和鉴别保真项,构造整体的目标函数;
步骤三、优化目标函数;从高低分辨率视频的特征中学习一对非对称映射、一对高低分辨率字典及一个映射矩阵,将低分辨率视频的特征转化为有鉴别的高分辨率特征;
步骤四、根据学习到的非对称映射、字典和映射矩阵,将高、低分辨率行人视频分别进行稀疏表示;
步骤五、通过步骤四得到的不同分辨率视频的稀疏表示,给定低分辨率probe视频集,计算与高分辨率gallery视频集的距离,并将距离最近的高分辨率视频作为匹配,实现不同分辨率视频间的行人重识别;
步骤二进一步包括:摄像头A得到的训练样本为高分辨率视频,摄像头B得到的为低分辨率样本;A=[A1,A2,...,AN],B=[B1,B2,...,BN]分别代表高分辨率视频和低分辨率视频的训练样本;N为训练样本的总数;对A执行下采样和平滑操作产生与B具有相同分辨率的图像集;O=[O1,...,Ok,...,OC]为C个模拟的低分辨率视频,C代表摄像头A的样本下采样比例的数目;
Ok=[Ok,1,...,Ok,2,...,Ok,N]表示采用第k个下采样率获得的模拟低分辨率样本集合;
学习一对字典用于不同分辨率视频的表示;X表示字典DH上A的编码系数矩阵,Zk为字典DL上Ok的系数矩阵,Y为字典DH上B的系数矩阵;DH和DL为高分辨率视频和低分辨率视频对应的字典;
摄像头A捕获的高分辨率视频为gallery集,摄像头B捕获的低分辨率视频为probe集;半耦合映射项如下:
其中P代表高分辨率和模拟低分辨率视频编码系数之间的半耦合映射矩阵,对低分辨率造成的信息损失进行补充;
步骤二中,视频重构误差项如下:
其中W,W′,V代表高分辨率,模拟低分辨率和低分辨率样本的非对称视频内映射;每个人的特征集中包含许多变量,非对称视频内映射的作用就是使得这些变量的影响最小,建模公式如下:
其中μi表示第i个行人视频特征集的中心,μi,k表示第k个模拟低分辨率视频集中第i个行人视频特征集的中心;是Ai的第j个特征向量,同理是Ok,i的第j个特征向量,是Bi的第j个特征向量;
对重构的视频特征,鉴别保真项如下:
其中<i,j>∈S表示第i个元素和第j个元素属于同一行人,<i,j>∈D表示两个元素属于不同行人;β为调整参数;学习到的映射P使得B中低分辨率特征系数重构后与A中高分辨率特征系数更近;
最后的PSDPL的目标函数同时结合视频重构误差,视频内映射和半耦合映射矩阵,如下:
其中为正则化项,将编码系数、视频内映射及映射矩阵正则化;α,η,θ,λ为平衡因子;I为单位矩阵;
步骤三中,当其余变量固定时,目标函数对于变量集合中每一个变量是凸的,利用交替迭代优化目标函数;公式(5)的目标函数分为4个子问题,即更新视频内映射W、W′和V,更新编码系数X、Z和Y,更新字典对DH和DL,更新稀疏表示系数间的映射矩阵P的4个子问题;
视频内的映射W、W′和V更新时,其他变量不变时,对于W,W′,V,公式(5)的目标函数分别写为:
对W求导,公式(6)的解为:
W′,V的解与W类似;
编码系数X、Z和Y更新时,移除系数X之外的其他参数,公式(5)中目标函数简化为:
公式(10)的解可通过将对Xi求导并设为0求解,Zk的解与Xi类似,Xi的解:
对于Yi,公式(5)中目标函数简化为:
公式(10)的解通过将对Yi求导并设为0求解,Xi的解:
更新字典DH和DL时,其他变量固定,目标函数简化为:
公式(14)和公式(15)通过ADMM算法求解;
更新视频稀疏表示间的映射矩阵P时,其他变量不变,仅考虑P,目标函数写为:
对P求导并设为0,求解得:
目标函数的优化流程如下:
输入:高分辨率视频和模拟的低分辨率视频的时空特征集A和O,低分辨率视频的时空特征集B;
初始化DH,DL,P,W,W′和V;参数α,β,λ,θ和η;
迭代下面步骤直到收敛:
1):固定其他变量,分别使用公式(6)、(7)和(8),更新W、W′和V;
2):固定其他变量,根据公式(11)和(13),更新X和Y;Zk的更新与X类似;
3):固定其他变量,使用公式(14)和(15)更新DH和DL;
4):固定其他变量,使用公式(17)更新映射矩阵P;
5)输出:视频内映射W和V、字典对DH,DL和映射矩阵P。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东石油化工学院,未经广东石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910324340.2/1.html,转载请声明来源钻瓜专利网。