[发明专利]基于字典对的多视角识别方法有效
申请号: | 201910712287.3 | 申请日: | 2019-08-02 |
公开(公告)号: | CN110533078B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 王磊;张帆;李丹萍;裴庆祺;马立川 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06F17/16 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于字典对的多视角识别方法,旨在同时考虑视角特征间的互补信息和视角特征内的判别信息,提高多视角识别精度。实现步骤:获取训练样本集和待识别样本集;构建训练样本集的字典对集;构建对角化约束矩阵集;构建系数嵌入矩阵、标签矩阵和常数矩阵;构建非负矩阵和投影矩阵;构建基于字典对的多视角识别模型;对基于字典对的多视角识别模型进行训练;对待识别样本集中的样本数据进行分类。本发明同时考虑了视角特征间的互补信息和视角特征内的判别信息,进而提高多视角识别的准确度,可用于动作识别、人脸识别和文本识别。 | ||
搜索关键词: | 基于 字典 视角 识别 方法 | ||
【主权项】:
1.一种基于字典对的多视角识别方法,其特征在于,包括如下步骤:/n(1)获取训练样本集X和待识别样本集Xtest:/n从多视角特征数据库中随机选取V种视角特征,每种视角特征包含Ntotal个样本数据,每个样本数据的类别数为m,并随机选取每种视角特征的N个样本数据构成训练样本集X,剩余的样本数据构成待识别样本集Xtest,其中,V≥1,Ntotal≥1,m≥1,1≤N<Ntotal,X={X1,X2,···,Xv,···,XV}, Xv表示训练样本集中的第v种视角特征, v=1,2,···,V, 表示Xv中的第n个样本数据, n=1,2,···,N,dv表示第v种视角特征中样本数据的维度,dv>1, 表示待识别样本集中的第v种视角特征, /n(2)构建训练样本集X的字典对集B:/n(2a)对训练样本集X中的每一种视角特征Xv进行奇异值分解,得到Xv的左酉矩阵Uv、特征值矩阵Sv和右酉矩阵Vv,其中, Sv∈Rk×k,Vv∈RN×k,k表示Xv的大于零的特征值的数目,k≥1;/n(2b)设置Xv的合成字典为Dv,解析字典为Pv,Dv和Pv构成Xv的字典对Bv,Bv={Dv,Pv},并令 令Pv中每一个位置的值均满足均值为0且方差为1的正态分布,再将V种字典对Bv组成训练样本集X的字典对集B,B={B1,B2,···Bv,···,BV},其中, 表示Dv中的字典原子数目,Uv(1:dv,1)表示Uv中的第一列数据,Sv(1,1)表示Sv中位于(1,1)位置的值, 表示Vv中位于第1列前 行的数据的转置;/n(3)构建对角化约束矩阵集A:/n(3a)统计训练样本集X中的每一种视角特征Xv中属于第j类的样本数目nj,以及Xv对应的合成字典Dv中属于第j类的字典原子数目bj, /n(3b)设置Xv的对角化约束矩阵为Av,并令 然后将V种视角特征的对角化约束矩阵组合成对角化约束矩阵集A,A={A1,A2,···,Av,···,AV},其中, 表示每一个位置的值均为1的列向量, 表示每一位置的值均为1的行向量, 表示每一个位置的值均为1的矩阵, /n(4)构建系数嵌入矩阵S、标签矩阵Y和常数矩阵E:/n构建每一个位置的值均为0的系数嵌入矩阵S,同时采用one-hot编码方法,并通过训练样本集X中的任意一种视角特征包含的样本数据的类别,构建标签矩阵Y,并通过Y构建常数矩阵E, 其中, Y∈Rm×N,E∈Rm×N, E(i,j)表示E中位于(i,j)位置的值,Y(i,j)表示Y中位于(i,j)位置的值,1≤i≤m,1≤j≤N;/n(5)构建非负矩阵M和投影矩阵W:/n构建每一个位置的值均为零的非负矩阵M,同时构建投影矩阵W,其中,M∈Rm×N, /n(6)构建基于字典对的多视角识别模型:/n /n /n其中, 表示Xv-DvPvXv的Frobenius范数,PvXvΘAv表示PvXv与Av对应位置的元素值相乘, 表示PvXvΘAv的Frobenius范数, 表示PX-S的Frobenius范数,PX=[P1X1;P2X2;···;PvXv;···;PVXV], 表示WS-(Y+EΘM)的Frobenius范数,EΘM表示E与M对应位置的元素相乘, 表示W的Frobenius范数, 表示Dv中的第t列数据, 为 的 范数,表示矩阵中所有元素平方的和, 表示 的 范数结果应当小于等于1,M≥0表示M中每一个位置的元素是非负的,λ表示对角化结构约束参数,α表示控制PX与S相似程度的约束参数,β表示控制WS与Y+EΘM相似程度的约束参数,τ表示防止W过拟合的约束参数;/n(7)对基于字典对的多视角识别模型进行训练:/n(7a)设置迭代次数为Tnum,最大迭代次数为Tmax,第Tnum次迭代后第v种视角特征Xv的解析字典Pv的更新结果为 第Tnum次迭代后第v种视角特征Xv的合成字典Dv的更新结果为 第Tnum次迭代后投影矩阵W的更新结果为 第Tnum次迭代后非负矩阵M的更新结果为 第Tnum次迭代后非负矩阵S的更新结果为 并令Tnum=0, /n(7b)采用最优方向法,并通过标签矩阵Y、常数矩阵E、V种视角特征Xv以及每种视角特征Xv的解析字典 投影矩阵 和非负矩阵 对系数嵌入矩阵S进行更新,得到更新后的系数嵌入矩阵 /n(7c)采用最优方向法,并通过第v种视角特征Xv和Xv的解析字典 对Xv的合成字典Dv进行更新,得到更新后的合成字典 /n(7d)采用最优方向法,并通过第v种视角特征Xv、Xv的对角化约束矩阵Av、 和 对Xv的解析字典Pv进行更新,得到更新后的解析字典 /n(7e)采用最优方向法,并通过标签矩阵Y、常数矩阵E、 和 对投影矩阵W进行更新,得到更新后的投影矩阵 /n(7f)采用最优方向法,并通过标签矩阵Y、常数矩阵E、 和 对非负矩阵M进行更新,得到更新后的非负矩阵 /n(7g)判断Tnum=Tmax是否成立,若是,计算训练样本集的投影变换矩阵C,否则,令Tnum=Tnum+1,并执行步骤(7b),其中,C的计算公式为:/nC=W[P1X1;P2X2;···;PvXv;···;PVXV]/n其中, C∈Rm×N, 表示最后一次迭代投影矩阵W更新的结果, 表示最后一次迭代后训练样本集中第v种视角特征Xv的解析字典Pv的更新结果;/n(8)对待识别样本集Xtest中的样本数据进行分类:/n计算待识别样本集Xtest的投影变换矩阵Ctest,并采用最邻近分类方法,以C为匹配模板,确定Ctest中每一列数据的类别,并将该结果作为待识别样本集Xtest中样本数据的分类结果,其中,Ctest的计算公式为:/n /n其中, /n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910712287.3/,转载请声明来源钻瓜专利网。