[发明专利]基于随机游走的动态流图数据顶点重要性更新方法和装置有效
| 申请号: | 202011315919.1 | 申请日: | 2020-11-22 |
| 公开(公告)号: | CN112417247B | 公开(公告)日: | 2022-04-05 |
| 发明(设计)人: | 曾国荪;丁春玲;孙志鹏 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9537 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 随机 游走 动态 数据 顶点 重要性 更新 方法 装置 | ||
本发明涉及一种基于随机游走的动态流图数据顶点重要性更新方法和装置,方法包括:按照时间序列实时获取关联数据,实时更新动态流图数据;在每一时刻动态流图数据更新过程中获取受影响顶点和新增顶点;动态流图数据中的各个顶点通过预设的随机游走方式生成随机游走路径;根据随机游走路径经过各个受影响顶点的总次数,计算或更新各个受影响顶点的PageRank值;将动态流图数据的原有顶点聚合为一个超顶点,并保留动态流图数据中新增顶点的所有连接边,将这些连接边的另一端连接该超顶点,从而获取新图,该新图中通过上述方法计算或更新各个新增顶点的PageRank值。与现有技术相比,本发明既保证了计算结果的准确性又保证了计算的实时性。
技术领域
本发明涉及动态流图数据顶点重要性更新领域,尤其是涉及一种基于随机游走的动态流图数据顶点重要性更新方法。
背景技术
最初的PageRank概念是指Web网页重要性的排序值,当前已泛指一个图中顶点重要性的排序值,通常通过图的连接矩阵和特征向量不断迭代收敛得到。大数据时代,随着社交网络的飞速发展,产生了许多大规模动态流图,需要计算图中各顶点的重要性,即PageRank,以便开展领域应用。例如,在动态社交网络中,需要根据顶点的PageRank,即时寻找朋友圈,或迅速发现犯罪团伙等。
传统的求解PageRank的方法主要包括基于静态图计算的PageRank方法、增量幂迭代方法和聚合增量计算方法等,上述方法存在以下缺陷:
1、基于静态图计算的PageRank方法在变化后的新图上利用全局图数据重新执行幂迭代方法计算更新PageRank,将消耗大量时间和计算资源,且很难满足相关图应用的实时性需求。
2、增量幂迭代方法提出增量式更新迭代模型,但该模型为了保证PageRank更新的精确性需要大量时间开销,同时,随着持续到达的流图更新PageRank的误差会不断累积。聚合增量方法很难确定需要聚合的顶点,聚合的程度会直接影响PageRank更新的质量以及计算复杂性。
综上,传统方法要么一味追求PageRank计算的准确性,导致难以应对持续快速变化的图数据;要么牺牲PageRank准确性来换取少量的计算,更新速度加快但随着流图持续的变化,PageRank的计算误差会不断累积;因此,传统方法在更新PageRank的准确性和实时性上难以达到合理平衡,很难适用于不断变化的动态流图环境,不能有效快速的更新其PageRank值,特别是需要实时处理的应用领域。
发明内容
本发明的目的就是为了克服上述现有技术存在PageRank计算不能同时具备准确性和实时性的缺陷而提供一种基于随机游走的动态流图数据顶点重要性更新方法。
本发明的目的可以通过以下技术方案来实现:
一种基于随机游走的动态流图数据顶点重要性更新方法,包括以下步骤:
按照时间序列实时获取关联数据,实时更新动态流图数据;
在每一时刻动态流图数据更新过程中获取受影响顶点和新增顶点;
所述动态流图数据中的各个顶点通过预设的随机游走方式生成随机游走路径;
根据所述随机游走路径经过各个所述受影响顶点的总次数,计算或更新各个受影响顶点的PageRank值;
将所述动态流图数据的原有顶点聚合为一个超顶点,并保留动态流图数据中新增顶点的所有连接边,将这些连接边的另一端连接该超顶点,从而获取新图,该新图的各个顶点通过预设的随机游走方式生成随机游走路径,根据所述随机游走路径经过各个所述新增顶点的总次数,计算或更新各个新增顶点的PageRank值;
所述随机游走方式具体为,某一顶点以α为概率向其他出边的后续顶点游走,以出度的倒数为概率选择其任意出边游走,每个顶点以1-α为概率停止游走,如果继续向后续的顶点游走,最多不超过R步,当遇到无出边的顶点时,即刻停止此轮游走。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011315919.1/2.html,转载请声明来源钻瓜专利网。





