[发明专利]基于字典对的多视角识别方法有效

专利信息
申请号: 201910712287.3 申请日: 2019-08-02
公开(公告)号: CN110533078B 公开(公告)日: 2022-03-22
发明(设计)人: 王磊;张帆;李丹萍;裴庆祺;马立川 申请(专利权)人: 西安电子科技大学
主分类号: G06V10/774 分类号: G06V10/774;G06V10/764;G06F17/16
代理公司: 陕西电子工业专利中心 61205 代理人: 陈宏社;王品华
地址: 710071 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种基于字典对的多视角识别方法,旨在同时考虑视角特征间的互补信息和视角特征内的判别信息,提高多视角识别精度。实现步骤:获取训练样本集和待识别样本集;构建训练样本集的字典对集;构建对角化约束矩阵集;构建系数嵌入矩阵、标签矩阵和常数矩阵;构建非负矩阵和投影矩阵;构建基于字典对的多视角识别模型;对基于字典对的多视角识别模型进行训练;对待识别样本集中的样本数据进行分类。本发明同时考虑了视角特征间的互补信息和视角特征内的判别信息,进而提高多视角识别的准确度,可用于动作识别、人脸识别和文本识别。
搜索关键词: 基于 字典 视角 识别 方法
【主权项】:
1.一种基于字典对的多视角识别方法,其特征在于,包括如下步骤:/n(1)获取训练样本集X和待识别样本集Xtest:/n从多视角特征数据库中随机选取V种视角特征,每种视角特征包含Ntotal个样本数据,每个样本数据的类别数为m,并随机选取每种视角特征的N个样本数据构成训练样本集X,剩余的样本数据构成待识别样本集Xtest,其中,V≥1,Ntotal≥1,m≥1,1≤N<Ntotal,X={X1,X2,···,Xv,···,XV},Xv表示训练样本集中的第v种视角特征,v=1,2,···,V,表示Xv中的第n个样本数据,n=1,2,···,N,dv表示第v种视角特征中样本数据的维度,dv>1,表示待识别样本集中的第v种视角特征,/n(2)构建训练样本集X的字典对集B:/n(2a)对训练样本集X中的每一种视角特征Xv进行奇异值分解,得到Xv的左酉矩阵Uv、特征值矩阵Sv和右酉矩阵Vv,其中,Sv∈Rk×k,Vv∈RN×k,k表示Xv的大于零的特征值的数目,k≥1;/n(2b)设置Xv的合成字典为Dv,解析字典为Pv,Dv和Pv构成Xv的字典对Bv,Bv={Dv,Pv},并令令Pv中每一个位置的值均满足均值为0且方差为1的正态分布,再将V种字典对Bv组成训练样本集X的字典对集B,B={B1,B2,···Bv,···,BV},其中,表示Dv中的字典原子数目,Uv(1:dv,1)表示Uv中的第一列数据,Sv(1,1)表示Sv中位于(1,1)位置的值,表示Vv中位于第1列前行的数据的转置;/n(3)构建对角化约束矩阵集A:/n(3a)统计训练样本集X中的每一种视角特征Xv中属于第j类的样本数目nj,以及Xv对应的合成字典Dv中属于第j类的字典原子数目bj/n(3b)设置Xv的对角化约束矩阵为Av,并令然后将V种视角特征的对角化约束矩阵组合成对角化约束矩阵集A,A={A1,A2,···,Av,···,AV},其中,表示每一个位置的值均为1的列向量,表示每一位置的值均为1的行向量,表示每一个位置的值均为1的矩阵,/n(4)构建系数嵌入矩阵S、标签矩阵Y和常数矩阵E:/n构建每一个位置的值均为0的系数嵌入矩阵S,同时采用one-hot编码方法,并通过训练样本集X中的任意一种视角特征包含的样本数据的类别,构建标签矩阵Y,并通过Y构建常数矩阵E,其中,Y∈Rm×N,E∈Rm×NE(i,j)表示E中位于(i,j)位置的值,Y(i,j)表示Y中位于(i,j)位置的值,1≤i≤m,1≤j≤N;/n(5)构建非负矩阵M和投影矩阵W:/n构建每一个位置的值均为零的非负矩阵M,同时构建投影矩阵W,其中,M∈Rm×N/n(6)构建基于字典对的多视角识别模型:/n /n /n其中,表示Xv-DvPvXv的Frobenius范数,PvXvΘAv表示PvXv与Av对应位置的元素值相乘,表示PvXvΘAv的Frobenius范数,表示PX-S的Frobenius范数,PX=[P1X1;P2X2;···;PvXv;···;PVXV],表示WS-(Y+EΘM)的Frobenius范数,EΘM表示E与M对应位置的元素相乘,表示W的Frobenius范数,表示Dv中的第t列数据,范数,表示矩阵中所有元素平方的和,表示范数结果应当小于等于1,M≥0表示M中每一个位置的元素是非负的,λ表示对角化结构约束参数,α表示控制PX与S相似程度的约束参数,β表示控制WS与Y+EΘM相似程度的约束参数,τ表示防止W过拟合的约束参数;/n(7)对基于字典对的多视角识别模型进行训练:/n(7a)设置迭代次数为Tnum,最大迭代次数为Tmax,第Tnum次迭代后第v种视角特征Xv的解析字典Pv的更新结果为第Tnum次迭代后第v种视角特征Xv的合成字典Dv的更新结果为第Tnum次迭代后投影矩阵W的更新结果为第Tnum次迭代后非负矩阵M的更新结果为第Tnum次迭代后非负矩阵S的更新结果为并令Tnum=0,/n(7b)采用最优方向法,并通过标签矩阵Y、常数矩阵E、V种视角特征Xv以及每种视角特征Xv的解析字典投影矩阵和非负矩阵对系数嵌入矩阵S进行更新,得到更新后的系数嵌入矩阵/n(7c)采用最优方向法,并通过第v种视角特征Xv和Xv的解析字典对Xv的合成字典Dv进行更新,得到更新后的合成字典/n(7d)采用最优方向法,并通过第v种视角特征Xv、Xv的对角化约束矩阵Av对Xv的解析字典Pv进行更新,得到更新后的解析字典/n(7e)采用最优方向法,并通过标签矩阵Y、常数矩阵E、对投影矩阵W进行更新,得到更新后的投影矩阵/n(7f)采用最优方向法,并通过标签矩阵Y、常数矩阵E、对非负矩阵M进行更新,得到更新后的非负矩阵/n(7g)判断Tnum=Tmax是否成立,若是,计算训练样本集的投影变换矩阵C,否则,令Tnum=Tnum+1,并执行步骤(7b),其中,C的计算公式为:/nC=W[P1X1;P2X2;···;PvXv;···;PVXV]/n其中,C∈Rm×N表示最后一次迭代投影矩阵W更新的结果,表示最后一次迭代后训练样本集中第v种视角特征Xv的解析字典Pv的更新结果;/n(8)对待识别样本集Xtest中的样本数据进行分类:/n计算待识别样本集Xtest的投影变换矩阵Ctest,并采用最邻近分类方法,以C为匹配模板,确定Ctest中每一列数据的类别,并将该结果作为待识别样本集Xtest中样本数据的分类结果,其中,Ctest的计算公式为:/n /n其中,/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910712287.3/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top