[发明专利]基于图自编码器的引用网络聚类方法在审
申请号: | 202111337446.X | 申请日: | 2021-11-08 |
公开(公告)号: | CN114037014A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 王琦;张育超;袁媛 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/762;G06N3/04;G06N3/08 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 常威威 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 编码器 引用 网络 方法 | ||
1.一种基于图自编码器的引用网络聚类方法,其特征在于步骤如下:
步骤1:输入引用网络数据,并对其进行加噪处理,以输入的原始引用网络数据作为正样本,以加噪后的引用网络数据作为其对应的负样本;
步骤2:分别将正样本数据和负样本数据输入到编码器,获得其对应的节点级表征,所述的编码器为两层图卷积神经网络,按下式进行计算:
其中,H表示获取的节点级表征,表示输入数据带自连的邻接矩阵,按照计算得到,A表示输入引用网络数据的邻接矩阵,矩阵中元素值为0表示引用网络中两个节点不相连,元素值为1表示引用网络中两个节点相连接,I表示和矩阵A大小相同的单位矩阵,其主对角元素为1,其余元素为0,表示带自连的邻接矩阵的度矩阵,其主对角线各元素分别为矩阵的各行元素之和,即i表示矩阵的行序号,j表示矩阵的列序号,l表示编码器的层数序号,H(l)表示编码器第l层卷积神经网络的输入特征,W(l)表示编码器第l层卷积神经网络的权重,l=0时,H(l)=X,X为输入引用网络数据的特征矩阵,σ(·)为激活函数;
步骤3:采用平均图池化函数对正样本数据的节点级表征H进行处理,获取其图级表征即
步骤4:将编码器输出的节点级表征输入到解码器中,获取重构的邻接矩阵,所述的解码器采用内积形式,按下式进行计算:
A′=σ(HHT) (2)
其中,A′为重构的邻接矩阵;
步骤5:通过神经网络反向梯度传播,对整体损失函数进行优化,直至整体损失达到最小或不再变化,完成网络参数优化,以此时编码器输出的节点级表征作为数据的最终表征;
所述的神经网络为步骤1至步骤4的所有处理和网络;
所述的整体损失函数Ltotal的计算公式如下:
Ltotal=Lencoder+βLdecoder (3)
其中,Lencoder为编码阶段损失函数,Ldecoder为解码阶段损失函数,β为超参数一,取值范围为[0,2];
编码阶段损失函数Lencoder的计算公式为:
Lencoder=L1+αL2 (4)
其中,L1表示局部互信息损失,L2表示全局互信息损失,α为超参数二,取值范围为[0,1];L1和L2的计算公式分别如下:
其中,N表示初始引用网络数据中节点的数量,M表示加噪后引用网络数据中节点的数量,X表示正样本数据的特征矩阵,A表示正样本数据的邻接矩阵,表示负样本数据的特征矩阵,表示负样本数据的邻接矩阵,E(X,A)表示正样本数据的期望,表示负样本数据的期望,表示第i个正样本数据的节点级表征,表示图级表征,表示第j个负样本数据的节点级表征,表示第i个正样本数据的原始特征,表示第j个负样本数据的原始特征,DL(·)表示局部互信息判别器,Wscore是得分矩阵,σ(·)为激活函数,DG(·)表示全局互信息判别器,
解码阶段损失函数Ldecoder的计算公式为:
其中,yij是正样本数据的邻接矩阵A的第i行第j列节点的值,是重构的邻接矩阵A′的第i行第j列节点的值;
步骤6:对数据的最终表征进行谱聚类,并以数据表征的聚类结果标签作为其对应数据的聚类标签,得到原始数据的聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111337446.X/1.html,转载请声明来源钻瓜专利网。