[发明专利]基于邻接信息熵与随机游走的链路预测方法及装置在审
| 申请号: | 202210459683.1 | 申请日: | 2022-04-28 |
| 公开(公告)号: | CN114580130A | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 张蕾;潘佳兴;郭茂祖;魏楚元;夏鹏飞;顾跃 | 申请(专利权)人: | 北京建筑大学 |
| 主分类号: | G06F30/18 | 分类号: | G06F30/18;G06K9/62 |
| 代理公司: | 北京荟英捷创知识产权代理事务所(普通合伙) 11726 | 代理人: | 张阳 |
| 地址: | 100044*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 邻接 信息 随机 游走 预测 方法 装置 | ||
本发明提供了一种基于邻接信息熵与随机游走的链路预测方法及装置,采用融合邻接信息熵的随机游走模式,基于邻域的随机游走模式对网络进行采样以及基于非邻接的游走模式对网络进行采样得到融合的网络游走序列集合,采样更加全面;然后基于图表示学习获取节点的动态向量表达,提取节点的多种含义,提高了链路预测能力。
技术领域
本发明涉及链路预测技术领域,具体而言,涉及一种基于邻接信息熵与随机游走的链路预测方法及装置。
背景技术
网络中的链路预测(Link Prediction)是指如何通过已知的网络节点以及网络结构等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性。这种预测既包含了对未知链接的预测也包含了对未来链接的预测。链路预测方法可以分为三类:最大似然法、概率模型和基于相似性的方法。
基于概率模型的方法,首先生成网络的抽象模型,然后根据该模型进行链路预测,其主流模型包括在传统图模型中考虑了实体之间依赖关系的图模型和考虑了高斯过程的随机关系模型。在这些模型中,网络的拓扑结构、节点的属性信息都要作为输入,这使得其无法灵活、有效地应用于仅具有连边关系的网络数据中。
最大似然模型的基本思路是先设定网络的一些基本组织原则或具体的连边机制,然后通过最大化观测到的网络连边的存在似然获得与具体组织原则或连边机制相关的参数,最后基于预设的组织原则,结合获取的最优参数对缺失连边进行预测。目前已有模型考虑过的组织原则包括网络中的层级性、网络中的社团结构以及网络中节点的局部度量等。这些方法的缺点是计算复杂度过高,使得其难以适用于现实场景中的大规模网络。
基于相似性的链路预测算法(或指标)的依据是连边倾向产生于彼此相似的节点之间。基于该假设,大量机制驱动的相似性刻画指标被提出,指标所依据的机制越贴近真实网络的生成过程,对应算法的预测准确性也越高。由于基于相似性方法具有较低的计算复杂度和广泛的适用性,逐渐应用于大规模的现实场景。最近一些关于图表示的研究被应用于链路预测。这些方法首先将网络连通性嵌入到一个低维空间中,通过比较嵌入向量可以获得节点之间的相似性。
上述方法至少存在以下两个缺点:
1.对节点进行游走序列采样时过度依赖邻域信息,不足以挖掘网络全部信息。现有方法在对网络进行随机游走时,仅通过已有链路进行采样。也就是说,如果两个节点没有一个共同的邻居,那么它们在未来建立链路的概率将被假定为零。然而在实际系统中,有一些没有共同邻居的节点也随时间建立了链路。这说明现有方法的采样模式是不全面的。
2.现有方法使用Skip-Gram将节点映射为一个静态的低维向量,这意味着一个节点对其他所有节点的意义是相同的。但是在实际应用中,某一节点对其他节点的意义是不同的,距离、标签、联系等因素都会使意义不同。例如在蛋白质相互作用关系网络中,蛋白质的相互作用关系由于蛋白酶、受体等不同体现出不同性质;社交网络中,人与人的关系也不尽相同;交通网络中,某个节点可能既是交通路口,也是地铁出入口。以上种种现象表明,用单一的、静态的低维向量表达节点特征导致信息缺失、表达不准确。
发明内容
为解决上述问题,本发明提供了一种基于邻接信息熵与随机游走的链路预测方法,所述方法包括:根据邻域随机游走与非近邻随机游走相融合的采样模式,对输入的网络图进行采样得到网络游走序列集合;所述网络游走序列集合包括多个节点的网络游走序列,各所述节点的网络游走序列包括:多个基于邻域随机游走模式采样得到的网络游走序列及多个基于非近邻随机游走模式采样得到的网络游走序列;对所述网络游走序列集合进行图表示学习,得到所述网络图对应的边缘向量;将所述边缘向量输入预先训练的预测模型,得到链路预测结果。
可选地,所述对所述网络游走序列集合进行图表示学习,得到所述网络图对应的边缘向量,包括:对所述节点的各网络游走序列分别进行图表示学习,得到所述节点的各网络游走序列对应的节点向量;将任意两个所述节点的节点向量转换为边缘向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京建筑大学,未经北京建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210459683.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





