[发明专利]大规模异构图节点表示的高效学习方法及装置有效

专利信息
申请号: 202110652830.2 申请日: 2021-06-11
公开(公告)号: CN113326884B 公开(公告)日: 2023-06-16
发明(设计)人: 罗翠铃;张吉;高军 申请(专利权)人: 之江实验室;北京大学
主分类号: G06F18/2415 分类号: G06F18/2415;G06N3/0464;G06N3/08
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 邱晓锋
地址: 311121 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 大规模 构图 节点 表示 高效 学习方法 装置
【说明书】:

本发明涉及一种大规模异构图节点表示的高效学习方法及装置。该方法计算异构图中节点的邻居的重要性,根据重要性对节点的邻居进行采样;然后根据异构图中节点的类型信息,学习节点的类型嵌入向量;然后将邻居的类型嵌入向量和属性特征进行融合,得到邻居的向量表示。本发明的大规模异构图节点表示的高效学习方法是在半监督设置下,综合利用异构图的拓扑结构、关系类型、特征属性等信息,在兼顾算法的高效性和可扩展性的情况下学习节点的向量表示,实现了对大规模异构图中缺失的节点标签的分类预测。

技术领域

本发明属于信息技术领域,具体涉及一种大规模异构图节点表示的高效学习方法及装置。

背景技术

当今时代,网络数据挖掘和分析已成为一个重要的研究领域。在网络数据中,不同事物之间的交互关系普遍可以用图这种数据结构进行有效的描述和抽象,而在复杂系统中,图结构通常具有多种类型的节点和边,表示不同类别的事物和关系。这样的图结构被归为异构图(相对只有单一类型的节点和边的同构图而言),广泛存在于现实生活中,如包含“论文”、“作者”、“会议”、“研究领域”等节点类型的学术网络。

图表示学习是一种表示或者编码图结构的方法,主要包括基于矩阵分解的算法、基于随机游走的算法、基于图神经网络的算法等。其中图神经网络对于同构图在理论上和工业界都有大量的创新与应用,针对大规模同构图的训练已有可观的突破,但对于大规模异构图的训练仍然具有挑战性。

现有的针对异构图的算法有一部分是由同构图的算法派生而来,经典的同构图神经网络可以通过加入对特定关系的转换,自然地将模型扩展到异构图上。异构图模型根据所利用信息的重点的不同,可以大致分为两类,一类是基于图结构的浅层模型,该类模型的重点在于利用边、元路径、子图等结构来学习丰富的语义信息;另一类是深层模型,在保持网络结构特性的同时,还整合了属性等额外信息,综合利用结构和属性信息,能捕捉和挖掘到更复杂的语义信息,例如由图注意力网络扩展而来的异构图注意力网络模型,由图卷积网络扩展而来的关系图卷积网络等。

对于上述第一类基于图结构的浅层模型,虽然允许并行计算,训练速度更快且计算复杂度相对较低,但对属性信息不能很好地利用和表示,也不能很好地扩展到大规模图上,因为这类模型只能学习已有节点的结构信息而不能应用到新节点上,只适用于直推式学习。而第二类综合利用结构和属性信息的深层模型,虽然有更强的表示能力,且适用于归纳式学习,但复杂度相对更高,在大规模图上的训练过程耗时耗力。因此,这两类异构图算法在大规模图上的可扩展性均受到一定的限制。

发明内容

为了提高异构图算法在大规模图上的可扩展性,在保证准确率等性能的前提下,快速高效地对异构图相应任务展开学习、训练和预测,本专利提出了一种大规模异构图节点表示的高效学习方法,该方法对异构图类型和结构分开学习再加以属性特征并整合利用三者信息,来学习节点的向量表示,在半监督节点分类任务上对于缺失的节点标签进行预测,在尽可能保证准确率的同时提高算法的效率和可扩展性。

本发明采用的技术方案如下:

一种大规模异构图节点表示的高效学习方法,其特征在于,包括以下步骤:

计算异构图中节点的邻居的重要性,根据重要性对节点的邻居进行采样;

根据异构图中节点的类型信息,学习节点的类型嵌入向量;

将邻居的类型嵌入向量和属性特征进行融合,得到邻居的向量表示。

进一步地,所述计算异构图中节点的邻居的重要性,根据重要性对节点的邻居进行采样,包括:

基于个性化PageRank算法计算邻居的重要性,通过求解ppr矩阵来对节点的邻居进行采样;ppr矩阵的每一行为对应节点的ppr向量,代表随机游走收敛时节点到达图上其余各节点的概率,概率越高表明邻居对节点越重要;通过选取ppr向量前k大的值来采样最重要的topk个邻居。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;北京大学,未经之江实验室;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110652830.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top