[发明专利]一种基于自适应子图的结构感知图对比学习方法在审
| 申请号: | 202210665049.3 | 申请日: | 2022-06-14 |
| 公开(公告)号: | CN115131605A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 于硕;彭寅;陈志奎;夏锋 | 申请(专利权)人: | 大连理工大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/08 |
| 代理公司: | 辽宁鸿文知识产权代理有限公司 21102 | 代理人: | 许明章;王海波 |
| 地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 自适应 结构 感知 对比 学习方法 | ||
本发明属于图表示学习领域,提出了一种基于自适应子图的结构感知图对比学习方法,用于图表示学习。该方法包括基于Motif的子图生成算法、图增强算法、基于Motif的子图嵌入算法、基于GNN的图嵌入算法以及子图对比学习框架。本发明可以在无监督场景下,帮助模型更好地捕捉局部语义信息,从而学习到高质量节点嵌入,用于下游图学习任务,如节点分类、链路预测、推荐系统等。本发明基于原始图中的motif信息,构建编码子图,可以有效减轻图增强对原始图语义信息的破坏;提出的基于motif的子图生成与编码策略和传统子图生成方法相比,可以捕捉更丰富的语义信息。
技术领域
本发明涉及图表示学习领域,具体涉及一种基于自适应子图的结构感知图对比学习方法。
背景技术
图学习作为深度学习最重要的分支之一,被广泛应用于各个领域,比如推荐系统、生物分子、异常检测等。图数据和传统的网格式数据不同,比如文本、语音、图像等,它是一种结构复杂的非欧式数据,难以应用传统神经网络、比如卷积神经网络(CNN)、循环神经网络(RNN)等进行解决图学习任务。
近年来,专门用于图数据的图神经网络(GNN)逐渐成为图学习的主流方法,比如图卷积网络(GCN)、图注意力网络(GAT)以及GraphSAGE等被广泛应用于各种图学习任务。虽然GNN在各个领域已经取得了很大的成功,但是它也存在弊端,即需要大量有标签数据,用于监督学习。然而,在现实世界中,一方面数据标记的代价越来越高,另一方面某些特殊领域,比如生物分子、化学等,标记数据需要大量领域相关知识,难以获得海量有标签数据。因此,无监督图学习方法也是图学习领域的研究热点之一。
传统的无监督图学习方法主要通过重构图的拓扑结构学习节点表示,比如Node2vec,VGAE等。这些方法过分强调了图的邻近性,导致在某些情景下模型性能欠佳。目前图对比学习(GCL)逐渐成为了最具代表性的无监督图学习方法,从数据本身来学习先验知识。具体来说,GCL通过对比原始数据的不同增强视角,最小化两个视角之间的互信息来学习节点表示,用于下游任务。
现有的GCL方法基本都是节点层级的对比,即对比两个增强视角间节点的差异性。这种方式忽略了图结构的复杂性,难以捕捉到蕴藏在图局部结构中的丰富语义信息,导致模型性能欠佳。另外,虽然存在一些基于子图对比的GCL方法,但是这些方法构建、编码子图的方式过于简单,同样无法完全获取蕴藏在图结构中的语义信息。
发明内容
本发明解决了现有图对比学习方法难以捕捉蕴藏在图拓扑结构中的语义信息的问题,可以学习到更高质量的节点嵌入,使得模型在下游任务中具有更好的表现。
本发明的技术方案如下:
一种基于自适应子图的结构感知图对比学习方法,具体包括步骤如下:
步骤1、生成子图;
基于原始图G=(V,E,A,X),其中,V为节点,E为边,A为邻接矩阵,X为特征矩阵;获取每个节点的motif信息,motif信息包括motif类型和数量分布信息;基于motif信息为每个节点构建子图,将包含目标节点的所有motif类型拼接到一起,组成一张子图;
对于原始图中的节点vi,寻找包含该节点的所有motif类型的motif信息构成的集合,表示成Mi={m1,...,mn},其中mi={vi,vj|vj∈V,i≠j};对于原始图中的节点vi,其子图包含的所有节点集合计算方法如下:
Si={ni|ni∈mj,mj∈Mi}
其中,ni表示子图中的节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210665049.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:仿生无动力管道机器人及控制方法
- 下一篇:图章及植物标本信息记录方法





