[发明专利]基于非对称映射半耦合字典对的低分辨率行人重学习方法有效

申请号：	201910324340.2	申请日：	2019-04-22
公开（公告）号：	CN110032984B	公开（公告）日：	2020-01-31
发明（设计）人：	荆晓远;马飞;訾璐;黄鹤;姚永芳;李娟娟	申请（专利权）人：	广东石油化工学院
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/46;G06K9/62
代理公司：	11401 北京金智普华知识产权代理有限公司	代理人：	杨采良
地址：	525000 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	映射低分辨率视频字典非对称分辨率视频半监督分辨率学习视频高分辨率视频低分辨率高分辨率视频对象特征转化投影矩阵有效解决有效应用重新识别准确率场景清晰
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于非对称映射半耦合字典对学习的低分辨率视频行人重学习方法，其特征在于，所述基于非对称映射半耦合字典对学习的低分辨率视频行人重学习方法包括：

步骤一、对高分辨率行人视频和低分辨率行人视频分别进行时空特征提取；

步骤二、设计视频重构误差项、半耦合映射项和鉴别保真项，构造整体的目标函数；

步骤三、优化目标函数；从高低分辨率视频的特征中学习一对非对称映射、一对高低分辨率字典及一个映射矩阵，将低分辨率视频的特征转化为有鉴别的高分辨率特征；

步骤四、根据学习到的非对称映射、字典和映射矩阵，将高、低分辨率行人视频分别进行稀疏表示；

步骤五、通过步骤四得到的不同分辨率视频的稀疏表示，给定低分辨率probe视频集，计算与高分辨率gallery视频集的距离，并将距离最近的高分辨率视频作为匹配，实现不同分辨率视频间的行人重识别；

步骤二进一步包括：摄像头A得到的训练样本为高分辨率视频，摄像头B得到的为低分辨率样本；A＝[A¹,A²,...,A^N]，B＝[B¹,B²,...,B^N]分别代表高分辨率视频和低分辨率视频的训练样本；N为训练样本的总数；对A执行下采样和平滑操作产生与B具有相同分辨率的图像集；O＝[O¹,...,O^k,...,O^C]为C个模拟的低分辨率视频，C代表摄像头A的样本下采样比例的数目；

O^k＝[O^k,1,...,O^k,2,...,O^k,N]表示采用第k个下采样率获得的模拟低分辨率样本集合；

学习一对字典用于不同分辨率视频的表示；X表示字典D_H上A的编码系数矩阵，Z^k为字典D_L上O^k的系数矩阵，Y为字典D_H上B的系数矩阵；D_H和D_L为高分辨率视频和低分辨率视频对应的字典；

摄像头A捕获的高分辨率视频为gallery集，摄像头B捕获的低分辨率视频为probe集；半耦合映射项如下：

其中P代表高分辨率和模拟低分辨率视频编码系数之间的半耦合映射矩阵，对低分辨率造成的信息损失进行补充；

步骤二中，视频重构误差项如下：

其中W,W′,V代表高分辨率，模拟低分辨率和低分辨率样本的非对称视频内映射；每个人的特征集中包含许多变量，非对称视频内映射的作用就是使得这些变量的影响最小，建模公式如下：

其中μⁱ表示第i个行人视频特征集的中心，μ^i,k表示第k个模拟低分辨率视频集中第i个行人视频特征集的中心；是Aⁱ的第j个特征向量，同理是O^k,i的第j个特征向量，是Bⁱ的第j个特征向量；

对重构的视频特征，鉴别保真项如下：

其中<i,j>∈S表示第i个元素和第j个元素属于同一行人，<i,j>∈D表示两个元素属于不同行人；β为调整参数；学习到的映射P使得B中低分辨率特征系数重构后与A中高分辨率特征系数更近；

最后的PSDPL的目标函数同时结合视频重构误差，视频内映射和半耦合映射矩阵，如下：

其中为正则化项，将编码系数、视频内映射及映射矩阵正则化；α,η,θ,λ为平衡因子；I为单位矩阵；

步骤三中，当其余变量固定时，目标函数对于变量集合中每一个变量是凸的，利用交替迭代优化目标函数；公式(5)的目标函数分为4个子问题，即更新视频内映射W、W′和V，更新编码系数X、Z和Y，更新字典对D_H和D_L，更新稀疏表示系数间的映射矩阵P的4个子问题；

视频内的映射W、W′和V更新时，其他变量不变时，对于W,W′,V，公式(5)的目标函数分别写为：

对W求导，公式(6)的解为：

W′,V的解与W类似；

编码系数X、Z和Y更新时，移除系数X之外的其他参数，公式(5)中目标函数简化为：

公式(10)的解可通过将对Xⁱ求导并设为0求解，Z^k的解与Xⁱ类似，Xⁱ的解：

对于Yⁱ，公式(5)中目标函数简化为：

公式(10)的解通过将对Yⁱ求导并设为0求解，Xⁱ的解：

更新字典D_H和D_L时，其他变量固定，目标函数简化为：

公式(14)和公式(15)通过ADMM算法求解；

更新视频稀疏表示间的映射矩阵P时，其他变量不变，仅考虑P，目标函数写为：

对P求导并设为0，求解得：

目标函数的优化流程如下：

输入：高分辨率视频和模拟的低分辨率视频的时空特征集A和O，低分辨率视频的时空特征集B；

初始化D_H,D_L,P,W,W′和V；参数α,β,λ,θ和η；

迭代下面步骤直到收敛：

1)：固定其他变量，分别使用公式(6)、(7)和(8)，更新W、W′和V；

2)：固定其他变量，根据公式(11)和(13)，更新X和Y；Z^k的更新与X类似；

3)：固定其他变量，使用公式(14)和(15)更新D_H和D_L；

4)：固定其他变量，使用公式(17)更新映射矩阵P；

5)输出：视频内映射W和V、字典对D_H,D_L和映射矩阵P。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东石油化工学院，未经广东石油化工学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910324340.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于ORB特征提取和FLANN快速匹配的轨迹识别方法
下一篇：一种血细胞自动检测识别方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于非对称映射半耦合字典对的低分辨率行人重学习方法有效

专利文献下载