[发明专利]随机游走、基于集群的随机游走方法、装置以及设备有效
申请号: | 201711144728.1 | 申请日: | 2017-11-17 |
公开(公告)号: | CN108073687B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 曹绍升;杨新星;周俊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/20 | 分类号: | G06F16/20 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 杨移 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机 游走 基于 集群 方法 装置 以及 设备 | ||
本说明书实施例公开了随机游走、基于集群的随机游走方法、装置以及设备,方案包括:获取图数据包含的各节点的信息,根据各节点的信息生成反映节点及其相邻节点之间的对应关系的二维数组,根据二维数组生成随机序列,实现在图数据中的随机游走;该方案可以既适用于集群也适用于单机。
技术领域
本说明书涉及计算机软件技术领域,尤其涉及随机游走、基于集群的随机游走方法、装置以及设备。
背景技术
随着计算机和互联网技术的迅速发展,很多业务都可以在网上进行,图计算是处理社交方面的网上业务的一种常用手段。
例如,对于社交风控业务中的账户欺诈识别:每个用户分别作为一个节点,若两个用户之间存在转账关系,则对应的两个节点之间存在一条边,边可以是无向的,也可以是根据转账方向定义了方向的;以此类推,可以得到包含多个节点和多条边的图数据,进而基于图数据进行图计算以实现风控。
随机游走算法是图计算中比较基础和重要的一环,其为上层复杂算法提供支持。在现有技术中,一般采用这样的随机游走算法:在数据库中随机读取图数据包含的一个节点,再继续在该数据库中随机读取该节点的一个相邻节点,以此类推,实现在图数据中的随机游走。
基于现有技术,需要能够应用于大规模图数据的更为高效的随机游走方案。
发明内容
本说明书实施例提供随机游走、基于集群的随机游走方法、装置以及设备,用以解决如下技术问题:需要能够应用于大规模图数据的更为高效的随机游走方案。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种基于集群的随机游走方法,包括:
所述集群获取图数据包含的各节点的信息;
根据所述各节点的信息,生成二维数组,所述二维数组的每行分别包括一个所述节点的相邻节点的标识;
根据所述二维数组,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
本说明书实施例提供的一种随机游走方法,包括:
获取根据图数据包含的各节点的信息生成的二维数组,所述二维数组的每行分别包括一个所述节点的相邻节点的标识;
根据所述二维数组,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
本说明书实施例提供的一种基于集群的随机游走装置,所述装置属于所述集群,包括:
获取模块,获取图数据包含的各节点的信息;
第一生成模块,根据所述各节点的信息,生成二维数组,所述二维数组的每行分别包括一个所述节点的相邻节点的标识;
第二生成模块,根据所述二维数组,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
本说明书实施例提供的一种随机游走装置,包括:
获取模块,获取根据图数据包含的各节点的信息生成的二维数组,所述二维数组的每行分别包括一个所述节点的相邻节点的标识;
生成模块,根据所述二维数组,生成随机序列,所述随机序列反映在所述图数据中的随机游走。
本说明书实施例提供的一种基于集群的随机游走设备,所述设备属于所述集群,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711144728.1/2.html,转载请声明来源钻瓜专利网。