[发明专利]基于图自编码器的引用网络聚类方法在审

专利信息
申请号: 202111337446.X 申请日: 2021-11-08
公开(公告)号: CN114037014A 公开(公告)日: 2022-02-11
发明(设计)人: 王琦;张育超;袁媛 申请(专利权)人: 西北工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06V10/762;G06N3/04;G06N3/08
代理公司: 西北工业大学专利中心 61204 代理人: 常威威
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 编码器 引用 网络 方法
【说明书】:

发明提供了一种基于图自编码器的引用网络聚类方法。首先,通过加噪处理获取原始数据对应的负样本;然后,利用编码器获取数据的节点级表征,再利用图池化函数获取图级表征,并利用解码器进行邻接矩阵重构,通过神经网络反向梯度传播,对整体损失函数进行优化,网络达到最优时的表征即为数据的最终表征;最后,通过对数据表征进行谱聚类获得原始数据的聚类结果。本发明充分利用了原始数据与学得的表征间的互信息、学得的表征和图级表征间的互信息,以及图数据的一阶和二阶空间拓扑结构,能够取得更好的聚类效果。

技术领域

本发明属图表征学习技术领域,具体涉及一种基于图自编码器的引用网络聚类方法。

背景技术

近年来,有关图结构数据的应用不断增长,图分析成为热门的研究方向。引用网络是一种图结构的数据,其将学术文献作为图结构数据中的顶点,将文献之间的相互引用关系作为图结构数据中的边。通过这种顶点和边的形式,引用网络展现出整体文献中各个文献的被引水平。图聚类是图分析的一种基本方法,其主要目的是根据图结构数据顶点间的相似程度,将图结构数据中的所有顶点划分为不同的组或类,使得同一类顶点的相似性比不同类顶点间的相似性更大。目前大多数图聚类方法的基本处理过程是:首先采用图表征学习技术对图结构数据进行预处理,然后进行聚类,主要分为以下三类方法:

(1)基于概率模型的方法。这类方法通常将图数据中的节点看作是句子中的单词,通过对图中节点随机进行游走,获得低维图嵌入向量。最具代表性的是Perozzi等人在文献B.Perozzi,R.Al-Rfou,and S.Skiena.Deepwalk:Online Learning ofSocialRepresentations.in Proceedings of International Conference on KnowledgeDiscovery and Data Mining,2014,pp.701-710中提出的DeepWalk算法,它利用通过截断随机游走(truncated random walk)学习出一个网络的表示。但该方法没有考虑节点本身的属性,只考虑了图的拓扑结构。

(2)基于矩阵因式分解的方法。这类方法通过对原始数据的特征矩阵进行因式分解,从而得到一个低维的特征矩阵。最具代表性的是X.Wang等人在文献X.Wang,P.Cui,J.Wang,J.Pei,W.Zhu,and S.Yang.“Community Preserving Network Embedding.inProceedings of AAAI Conference on Artificial Intelligence,vol.33,no.1,2017提出的M-NMF算法,该方法在学得图表征的时候不仅考虑了图的微观结构,同时还考虑了图数据的介观社区结构。但该方法同样没有考虑节点本身的属性。

(3)基于深度学习的方法。这类方法通过神经网络对原始的图数据进行特征选择。最具代表性的是P.Velickovic等人在文献P.Velickovic,W.Fedus,W.Hamilton,B.Nadler,P.Liò,Y.Bengio,and R.Hjelm.Deep Graph Infomax.in Proceedings ofInternational Conference on Learning Representations,2019提出的DGI算法,该方法采用图卷积网络学习图节点的表征,同时考虑了图级和节点级特征之间的互信息。该方法的问题在于没有考虑原始特征和学得的节点级表征间的互信息,且采用了单层图卷积神经网络,没有考虑图中节点的二阶相似性。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111337446.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top