[发明专利]一种基于子图划分的图半监督学习的分布式实现方法在审
申请号: | 202010068356.4 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111275201A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 蒋俊正;黄炟鑫;冯海荣;卢军志;池源 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 刘梅芳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 划分 监督 学习 分布式 实现 方法 | ||
1.一种基于子图划分的图半监督学习的分布式实现方法,其特征在于,包括如下步骤:
1)构建图:半监督学习的数据集为数据集内共有N个样本,xn表示第n个样本,数据集中的标签都来自于内有c类标签,其中,{x1,x2,...xl}的标签信息是已知的、对应的标签信息为而{xl+1,...,xn}的标签信息是未知的,依据中样本的相似性,建立一个图与E分别为节点集与边集,中的每一个节点对应数据集中的每一个样本,E中包含节点的连接信息;
2)优化问题建模:将待处理数据集的标签信息表示成一个图信号f=[f1,…,fn]T,信号值即为对应样本的标签,图半监督学习的优化问题的定义如下:
公式(1)把每一类标签的信息传播给标签信息未知的样本,接着,公式(2)提取出最终的分类结果,公式(1)中F为分类矩阵,Y为已知标签信息矩阵,二者均为N×c的矩阵,Y通过待处理数据集f生成,生成方式如下:
公式(1)中,为匹配项,τ为权重因子,为惩罚项,被设置为其中Lnorm=I-D-1/2WD-1/2为图归一化拉普拉斯矩阵,其中I为单位阵,D为度矩阵,W为邻接矩阵,将公式(1)中对于第j类标签信息的传播表述为:
公式(4)可表述为:
公式(5)中fj=F:,j,yj=Y:,j,是fj的转置;
3)子图划分与优化问题分解:采用指示运算符对图进行子图划分,指示运算符为一个对角阵,定义为:
公式(7)中的B(k,2r)是节点集合,其包含k与半径2r范围内的邻居节点,对于节点k,为节点k划分出一个以k为中心、节点集合为B(k,2r)的子图对于节点数为N的图来说,共有N个这样的子图,如公式(5)所示的优化问题被投影到每个子图上,对于每个节点k与对应的子图均有一个对应的优化子问题如公式(8)所示:
公式(8)中fj,k是f在子图中的投影,
4)子问题求解与解的拼接:对步骤3)中如公式(8)所示的子问题依据公式(10)进行求解:
公式(10)中C=τI+Lnorm,bj=yj,是节点k与其邻居提供的局部解,依据公式(11)把所有节点上的局部解拼接起来,再进行求平均:
公式(11)中的是对于公式(5)的全局问题的解的近似;
5)迭代求解:依据公式(12)采用迭代计算方式使接近全局问题如公式(5)的解:
公式(12)中,右上角的m为迭代次数,
6)分布式求解:对于节点k与对应的子图有:
6-1)bj被投影到子图上,得到bj,k,令其为子图上节点的初始信号值,即
6-2)算子P被投影到子图上,对应的信息用向量pk来表示;
6-3)计算其为局部近似迭代解在节点k上的值;
6-4)计算用局部近似迭代解更新局部近似解在节点k上的值;
6-5)让节点k与2r内的邻居节点进行信息交换,生成子图上的局部解vj,k;
6-6)计算
6-7)再次进行信息交换,这次交换的是在对应子图节点上的值,生成下一次迭代的初始值
6-8)判断终止条件|vj(k)|<ε是否达到:如果达到终止条件|vj(k)|<ε,则把所有节点上的拼接到一起生成标签j的传播结果fj,并开始下一个标签信息的传播;如果没有达到终止条件|vj(k)|<ε,则进行初始值为的下一次迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010068356.4/1.html,转载请声明来源钻瓜专利网。