[发明专利]一种对复杂网络进行链路预测的方法有效
申请号: | 201811253235.6 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109214599B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 谷伟伟;高飞;张江 | 申请(专利权)人: | 北京师范大学;集智学园(北京)科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G16B5/00 |
代理公司: | 江苏海越律师事务所 32402 | 代理人: | 唐小红 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 网络 进行 预测 方法 | ||
本发明提供了一种对复杂网络进行链路预测的方法,基于图注意力网络(GAT)的端到端链路预测模型,以及该模型的分批训练方法。该模型的关键在于学习网络节点对周围邻居的注意力分布。模型的训练和利用模型预测的步骤包括:步骤一,输入无权无向同质网络的拓扑结构;步骤二,根据训练集的拓扑结构对所有节点进行一阶、二阶邻居采样,以便将网络分批;步骤三,将分批后的训练集输入上述模型训练出模型参数;步骤四,输入想要预测的点对,模型输出该点对之间有连边的概率。本发明所述模型具有端到端的特点。分批训练方法使得该模型对大规模复杂网络也适用。
技术领域
本发明涉及深度学习与网络科学的交叉领域,具体涉及一种端到端的复杂网络链路预测模型和其分批训练方法。该模型利用注意力机制,结合网络拓扑结构,能表征网络连边。分批训练的方法使得该网络能处理大规模网络的链路预测问题。
技术背景
大规模的复杂网络普遍存在于现实世界中,例如万维网、航空网络、在线社交网络和蛋白质网络等等。理解,预测和控制这些复杂网络是人类日益迫切的需求。复杂网络的研究属于交叉领域,即有从数学和物理角度的理论研究,也有结合计算机技术的算法研究,是当前科学领域的研究热点之一。一般情况下,复杂网络包含的连边繁多且不易被观察,人们收集的数据中不可避免的存在缺失和错误的连边;另外,限于人力物力,人们只能统计部分连边状况,不能遍历所有连边。链路预测是一种解决问题的技术,该技术使我们能在部分网络结构的基础上预测出隐藏的连边,并发现虚假的连边。在交通网络规划、在线社交、蛋白质功能等许多涉及复杂网络的领域中,链路预测技术都能带来很大的效益。传统的链路预测方法一般将网络各部分看作同质的,不区分各部分对目标节点影响力大小,这不符合实际情况,因而其预测效果也存在一定的瓶颈。
发明内容
本发明目的在于利用注意力机制,克服上述提出的传统链路预测算法中的缺陷,提出一种基于GAT的端到端链路预测模型。该模型具有可学习的注意力权重,可以对网络不同部分分配不同的注意力大小。具体来说,本模型具有两层注意力模型,能在注意力的指导下聚合节点的一阶、二阶邻居信息,将聚合的信息组合成连边向量,再通过分类器判断该连边存在的概率值。利用训练集中的样本,指导本模型中各项参数通过梯度反传方法进行学习。用训练好的模型参数预测新节点对之间是否存在连边。另一方面,直接聚合节点所有邻居的向量需要将整个网络输入到模型中,当网络规模较大时,很难满足其所需计算机存储空间。针对于此,本发明通过对所有节点进行邻居采样,固定节点邻居数量,规避网络的幂率(power law)性质所带来的内存消耗,同时可以将单个大网络进行分批训练,提高收敛速度和GPU运算效率。
为了实现上述目的,本发明提供了一种基于图注意力的端到端链路预测模型和其分批训练方法。所述端到端链路预测模型包括:双层图注意力模型和逻辑回归分类器;所述方法包括:对复杂网络各节点进行固定邻居采样;根据网络连边生成训练集并对其中的节点和邻居进行分批,每个节点赋予初始化向量,生成训练数据;将训练数据输入双层注意力模型,得到各点的更新向量,将点对的向量组合成连边的向量;将连边的向量通过逻辑回归得到该连边是否存在的概率值;根据损失函数对模型参数进行更新;所述链路预测模型包括训练好的双层注意力模型和逻辑回归分类器。
上述技术方案中,所述方法具体包括:
1).对需要处理的目标网络进行去方向去权重处理,得到网络无向无权的同质拓扑结构,该网络不能包含孤立节点。
2).上述网络中连边对应的点对作为训练集中的正例,同时随机采集与连边数等量没有连边的点对,作为训练集中的负例。对正负例中出现的所有点进行固定数目一阶、二阶邻居采样,节点和其邻居看做整体,然后将训练集分批。
3).构建基于GAT的端到端链路预测模型,包含以下部分:
3.1).模型输入为点对和他们的一阶、二阶邻居,输出为该点对之间有连边的概率;
3.2).根据网络数据实际情况,初始化节点向量为其中i为节点下标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学;集智学园(北京)科技有限公司,未经北京师范大学;集智学园(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811253235.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理