[发明专利]基于字典对的多视角识别方法有效

申请号：	201910712287.3	申请日：	2019-08-02
公开（公告）号：	CN110533078B	公开（公告）日：	2022-03-22
发明（设计）人：	王磊;张帆;李丹萍;裴庆祺;马立川	申请（专利权）人：	西安电子科技大学
主分类号：	G06V10/774	分类号：	G06V10/774;G06V10/764;G06F17/16
代理公司：	陕西电子工业专利中心 61205	代理人：	陈宏社;王品华
地址：	710071 陕***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提出了一种基于字典对的多视角识别方法，旨在同时考虑视角特征间的互补信息和视角特征内的判别信息，提高多视角识别精度。实现步骤：获取训练样本集和待识别样本集；构建训练样本集的字典对集；构建对角化约束矩阵集；构建系数嵌入矩阵、标签矩阵和常数矩阵；构建非负矩阵和投影矩阵；构建基于字典对的多视角识别模型；对基于字典对的多视角识别模型进行训练；对待识别样本集中的样本数据进行分类。本发明同时考虑了视角特征间的互补信息和视角特征内的判别信息，进而提高多视角识别的准确度，可用于动作识别、人脸识别和文本识别。
搜索关键词：	基于字典视角识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于字典对的多视角识别方法，其特征在于，包括如下步骤：/n(1)获取训练样本集X和待识别样本集X^test：/n从多视角特征数据库中随机选取V种视角特征，每种视角特征包含N_total个样本数据，每个样本数据的类别数为m，并随机选取每种视角特征的N个样本数据构成训练样本集X，剩余的样本数据构成待识别样本集X^test，其中，V≥1，N_total≥1，m≥1，1≤N＜N_total，X＝{X₁,X₂,···,X_v，···,X_V}，X_v表示训练样本集中的第v种视角特征，v＝1,2,···,V，表示X_v中的第n个样本数据，n＝1,2,···,N，d_v表示第v种视角特征中样本数据的维度，d_v＞1，表示待识别样本集中的第v种视角特征，/n(2)构建训练样本集X的字典对集B：/n(2a)对训练样本集X中的每一种视角特征X_v进行奇异值分解，得到X_v的左酉矩阵U_v、特征值矩阵S_v和右酉矩阵V_v，其中，S_v∈R^k×k，V_v∈R^N×k，k表示X_v的大于零的特征值的数目，k≥1；/n(2b)设置X_v的合成字典为D_v，解析字典为P_v，D_v和P_v构成X_v的字典对B_v，B_v＝{D_v,P_v}，并令令P_v中每一个位置的值均满足均值为0且方差为1的正态分布，再将V种字典对B_v组成训练样本集X的字典对集B，B＝{B₁,B₂,···B_v,···,B_V}，其中，表示D_v中的字典原子数目，U_v(1:d_v,1)表示U_v中的第一列数据，S_v(1,1)表示S_v中位于(1,1)位置的值，表示V_v中位于第1列前行的数据的转置；/n(3)构建对角化约束矩阵集A：/n(3a)统计训练样本集X中的每一种视角特征X_v中属于第j类的样本数目n_j，以及X_v对应的合成字典D_v中属于第j类的字典原子数目b_j，/n(3b)设置X_v的对角化约束矩阵为A_v，并令然后将V种视角特征的对角化约束矩阵组合成对角化约束矩阵集A，A＝{A₁,A₂,···,A_v,···,A_V}，其中，表示每一个位置的值均为1的列向量，表示每一位置的值均为1的行向量，表示每一个位置的值均为1的矩阵，/n(4)构建系数嵌入矩阵S、标签矩阵Y和常数矩阵E：/n构建每一个位置的值均为0的系数嵌入矩阵S，同时采用one-hot编码方法，并通过训练样本集X中的任意一种视角特征包含的样本数据的类别，构建标签矩阵Y，并通过Y构建常数矩阵E，其中，Y∈R^m×N，E∈R^m×N，E(i,j)表示E中位于(i,j)位置的值，Y(i,j)表示Y中位于(i,j)位置的值，1≤i≤m，1≤j≤N；/n(5)构建非负矩阵M和投影矩阵W：/n构建每一个位置的值均为零的非负矩阵M，同时构建投影矩阵W，其中，M∈R^m×N，/n(6)构建基于字典对的多视角识别模型：/n /n /n其中，表示X_v-D_vP_vX_v的Frobenius范数，P_vX_vΘA_v表示P_vX_v与A_v对应位置的元素值相乘，表示P_vX_vΘA_v的Frobenius范数，表示PX-S的Frobenius范数，PX＝[P₁X₁；P₂X₂；···；P_vX_v；···；P_VX_V]，表示WS-(Y+EΘM)的Frobenius范数，EΘM表示E与M对应位置的元素相乘，表示W的Frobenius范数，表示D_v中的第t列数据，为的范数，表示矩阵中所有元素平方的和，表示的范数结果应当小于等于1，M≥0表示M中每一个位置的元素是非负的，λ表示对角化结构约束参数，α表示控制PX与S相似程度的约束参数，β表示控制WS与Y+EΘM相似程度的约束参数，τ表示防止W过拟合的约束参数；/n(7)对基于字典对的多视角识别模型进行训练：/n(7a)设置迭代次数为T_num，最大迭代次数为T_max，第T_num次迭代后第v种视角特征X_v的解析字典P_v的更新结果为第T_num次迭代后第v种视角特征X_v的合成字典D_v的更新结果为第T_num次迭代后投影矩阵W的更新结果为第T_num次迭代后非负矩阵M的更新结果为第T_num次迭代后非负矩阵S的更新结果为并令T_num＝0，/n(7b)采用最优方向法，并通过标签矩阵Y、常数矩阵E、V种视角特征X_v以及每种视角特征X_v的解析字典投影矩阵和非负矩阵对系数嵌入矩阵S进行更新，得到更新后的系数嵌入矩阵/n(7c)采用最优方向法，并通过第v种视角特征X_v和X_v的解析字典对X_v的合成字典D_v进行更新，得到更新后的合成字典/n(7d)采用最优方向法，并通过第v种视角特征X_v、X_v的对角化约束矩阵A_v、和对X_v的解析字典P_v进行更新，得到更新后的解析字典/n(7e)采用最优方向法，并通过标签矩阵Y、常数矩阵E、和对投影矩阵W进行更新，得到更新后的投影矩阵/n(7f)采用最优方向法，并通过标签矩阵Y、常数矩阵E、和对非负矩阵M进行更新，得到更新后的非负矩阵/n(7g)判断T_num＝T_max是否成立，若是，计算训练样本集的投影变换矩阵C，否则，令T_num＝T_num+1，并执行步骤(7b)，其中，C的计算公式为：/nC＝W[P₁X₁；P₂X₂；···；P_vX_v；···；P_VX_V]/n其中，C∈R^m×N，表示最后一次迭代投影矩阵W更新的结果，表示最后一次迭代后训练样本集中第v种视角特征X_v的解析字典P_v的更新结果；/n(8)对待识别样本集X^test中的样本数据进行分类：/n计算待识别样本集X^test的投影变换矩阵C^test，并采用最邻近分类方法，以C为匹配模板，确定C^test中每一列数据的类别，并将该结果作为待识别样本集X^test中样本数据的分类结果，其中，C^test的计算公式为：/n /n其中，/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910712287.3/，转载请声明来源钻瓜专利网。

上一篇：用于高光谱图像分类的形状自适应卷积深度神经网络方法
下一篇：形成图像样本的方法、装置、介质以及电子设备

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于字典对的多视角识别方法有效

专利文献下载