[发明专利]基于点对关系学习和重构的图像特征二值编码表示方法有效
| 申请号: | 201810203371.8 | 申请日: | 2018-03-13 |
| 公开(公告)号: | CN108536750B | 公开(公告)日: | 2022-03-18 |
| 发明(设计)人: | 杨育彬;甘元柱;毛晓蛟 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06V10/762;G06V10/772;G06K9/62 |
| 代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华;于瀚文 |
| 地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 关系 学习 图像 特征 编码 表示 方法 | ||
1.基于点对关系学习和重构的图像特征二值编码表示方法,其特征在于,包括以下步骤:
步骤1,求解系数矩阵:将图像数据表示成字典与系数矩阵的线性组合,通过求解对系数矩阵的约束模型从而求得系数矩阵;
步骤2,字典分割:对步骤1中获得的系数矩阵构造表示一个图的权值矩阵,在这个图上通过谱聚类将字典项分割成k2个组;
步骤3,特征表示:当给定新样本时,计算它在所有字典项组上的重构残差,然后从中选取最小的重构残差对应的最优字典项组来进行线性表示,完成点对关系的学习;
步骤4,点对关系重构:求解最优模型,从而学习到保持点对关系的最优的二值编码,实现点对关系的重构;
步骤1包括:
步骤1-1,给定一个包含n个图像数据的矩阵D=[x1,x2,...,xn]∈Rd×n,其中D的每一列表示一个图像数据,xn表示第n个图像数据,每个图像数据的维度为d,矩阵D能够自表示为D=DC,矩阵的每一个元素的值属于实数集R,其中C∈Rn×n是系数矩阵,每一列表示每个原始数据在字典上对应的重构系数,所述字典即数据矩阵D本身,对系数矩阵施加能够描述原始数据的全局结构性的低秩性约束和能够描述原始数据的局部结构性的稀疏性约束,得到如下模型对字典进行分组:
其中||·||*和||·||1分别表示矩阵核范数和l1范数,它们分别被作为对系数矩阵进行低秩性约束的近似和稀疏性约束的近似,s.t.表示约束,λ是一个用于平衡稀疏性和低秩性之间的重要度的平衡参数;
步骤1-2,求解步骤1-1中的模型,引入一个辅助变量J得到如下模型:
该模型的增广拉格朗日函数L(C,J,Y1,Y2,μ)为:
其中,Y1,Y2,μ表示为了求解模型所引入的辅助变量,通过对各变量即C,J,Y1,Y2,μ的迭代更新,对该模型进行求解,迭代更新各变量的规则如下:
Jk+1=max(|Ck+1+Y2,k/μk|-λ/μk,0)
Y1,k+1=Y1,k+μk(D-DCk+1)
Y2,k+1=Y2,k+μk(Ck+1-Jk+1)
μk+1=min(μmax,ρμk)
其中,Ck+1表示变量C第k+1次迭代更新后的值,Jk表示变量J第k次迭代更新后的值,μk表示变量μ第k次迭代更新后的值,Y1,k表示变量Y1第k次迭代更新后的值,Y2,k表示变量Y2第k次迭代更新后的值,μmax表示变量μ设定的最大值,ρ表示变量μ的增长系数,Θ表示奇异值收缩操作符且通过迭代求得学习到的系数矩阵C;
步骤2包括:
步骤2-1,将步骤1中获得的系数矩阵C表示一个图的权值矩阵W,计算如下:
W=(C+CT)/2;
步骤2-2,构建n×n对角度矩阵Dw,Dw定义如下:
其中di定义为:di=∑wij,
wij是指矩阵W的第i行第j列的数的值;
步骤2-3,定义拉普拉斯矩阵L=Dw-W,并根据L,Dw计算Dw-1/2LDw-1/2;
步骤2-4,计算Dw-1/2LDw-1/2最小的k1个特征值所各自对应的特征向量f,将特征向量f标准化,最终组成n×k1维的特征矩阵F;
步骤2-5,对特征矩阵F中的每一行作为一个k1维的样本,共n个样本,用聚类方法进行聚类,聚类维数为k2,第i行所属的类就是原来xi所属的类,最后得到簇划分c,从而将字典项分割成k2个组;
步骤3包括:
步骤3-1,当给定一个新样本x′,对于整个字典D,计算x′的重构系数zi:
zi=(DTD+αI)-1DTx′,
其中,α为平衡参数,I为单位矩阵;
步骤3-2,针对每个字典项组,计算各自对于x′的归一化残差:通过如下公式计算第k个字典项组对于x′的归一化残差rk(x′):
其中,φk_d(zi)是zi的一部分系数,其对应的字典项是第k_d个字典组,Dk表示第k个字典项组的数据所组成的字典;
步骤3-3,计算完x′的重构系数zi在所有字典项组上的归一化残差后,挑选计算得到的重构残差最小的字典项组作为最优字典项组,对最优字典项组进行线性表示,通过稀疏编码对x′进行重构表示,从而完成点对关系的学习;
步骤4包括:
求解如下模型,来学习最优的二值编码从而保持点对关系:
s.t.WrecWrecT=I
其中Wrec是线性投影矩阵,Zrec是数据矩阵,B∈{-1,1}c×n是一个二值矩阵,每列表示矩阵Zrec中数据对应的二值编码,μrec是一个偏移参数,s是一个缩放参数,||·||F表示矩阵的F范数,⊙表示对应元素的相乘,模型是凸的,通过迭代更新各个未知参数μrec、B、Wrec、s来进行优化,直到目标函数值收敛;
所述通过迭代更新各个未知参数来进行优化,直到目标函数值收敛,具体包括:
步骤4-1,随机初始化B和Wrec:
Wr是为了初始化Wrec而从标准正态分布随机采样的矩阵,Wr=UKVT表示对Wr矩阵进行奇异值分解,设定Wr是一个m×n阶矩阵,则分解后U是一个m×m阶矩阵,K是一个m×n阶对角矩阵,而V是一个n×n阶矩阵,c是指二值编码的长度;
初始化μrec=0,s=1;
步骤4-2,开始新一轮迭代,迭代次数加一,如果迭代次数小于等于T次,进行步骤4-3,否则执行步骤4-4;
步骤4-3,更新B:
令
计算
更新Wrec:
令
计算
更新μrec:
μrec=column_mean(Zrec-s⊙WrecTB),
更新s:
令
计算
结束本轮迭代,返回步骤4-2;
步骤4-4,经过迭代计算,最后学习到的最优二值编码矩阵B,完成点对关系的重构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810203371.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





