[发明专利]图数据搜索系统、方法和设备在审

专利信息
申请号: 201510112032.5 申请日: 2015-03-13
公开(公告)号: CN105045790A 公开(公告)日: 2015-11-11
发明(设计)人: 樊文飞;王欣;吴颖徽 申请(专利权)人: 北京航空航天大学;华为技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京龙双利达知识产权代理有限公司 11329 代理人: 王君;肖鹂
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 搜索 系统 方法 设备
【说明书】:

技术领域

发明实施例涉及信息技术领域,并且更具体地,涉及图数据搜索系统、方法和设备。

背景技术

很多现实中的计算问题都会涉及到大规模的图。网页链接关系和各种社交关系是这种大规模图的最典型的例子。这些图可能具有大量的顶点以及边。如何对图进行高效率的搜索以获取所需的内容是一项亟待解决的问题。

谷歌(Google)提出的Pregel技术是一种效率较高的图搜索机制。Pregel技术是通过主从结构的系统实现的。在需要对一个特定关系(即查询计划)进行搜索时,主节点(Master)会将保存的完整的图数据进行分区,将完整的图划分为多个子图,并将子图发送给多个从节点(Worker)。每个从节点可以接收一个或多个子图。节点负责维护分配给自己的子图的顶点(vertex)和边(edge)的状态信息。节点为每个子图分配一个线程。该线程根据计算任务对每一个处于激活(active)状态的顶点进行计算,计算完成后,根据边的链接信息,通过消息传递方式将计算结果传递给其它相邻的从节点,直到没有激活状态顶点或者迭代次数达到指定数目。

Pregel中,Master和Worker都是计算站点,Master负责调度Worker进行计算。因此,Pregel存在以下问题:消息传播和计算过程中的大量步骤都是串行化步骤,即必须在一个步骤完成之后再执行下一个步骤;消息传递数量以及总体并行化运行时间等方面很难获得理论上界;消息传递开销会影响图数据搜索的性能。

发明内容

本发明实施例提供图数据搜索系统、方法和设备,提高图数据搜索的效率与可扩展性。

第一方面,提供了一种图数据搜索系统,该系统包括一个主计算站点和M个子计算站点,该M个子计算站点中每个子计算站点均存储总图数据中的部分图数据,该部分图数据包括多个节点和用于连接该多个节点中的两个节点之间的边,其中M为大于1的正整数;其中,该主计算站点用于将查询计划发送给该M个子计算站点中的N个子计算站点,其中该查询计划采用图仿真的查询语义,N为小于或等于M的正整数;该N个子计算站点中的第一子计算站点用于接收该主计算站点发送的该查询计划;该第一子计算站点还用于根据该查询计划,对该第一子计算站点存储的第一部分图数据进行迭代查询,以确定该第一部分图数据包括的多个节点中与该查询计划相匹配的至少一个匹配节点,该至少一个匹配节点组成该第一子计算站点的本地匹配节点集合;该第一子计算站点还用于向该主计算节点发送该第一子计算节点的本地匹配节点集合;该主计算站点还用于接收该N个子计算站点中的每个子计算节点发送的该每个子计算节点的本地匹配节点集合,并且根据该N个子计算站点中的每个子计算节点的本地匹配节点集合,确定对应于该查询计划的匹配结果。

结合第一方面,在第一种可能的实现方式中,该第一子计算站点还用于确定该第一部分图数据中包括的与该查询计划相关的第一节点,其中,该第一节点与第二部分图数据中包括的第二节点之间具有跨站点边,该N个计算子节点中的第二子节点存储有该第二部分图数据;该第一子计算站点还用于向该第二子计算站点发送第一匹配指示消息,该第一匹配指示消息用于指示该第一节点与该查询计划的匹配结果。

结合上述可能的实现方式,在第二种可能的实现方式中,该第一子计算站点还用于接收该N个子计算节点中的第三子计算站点发送的第二匹配指示消息,该第二匹配指示消息用于指示第三站点与该查询计划的匹配结果,其中,该第三子计算节点存储有第三部分图数据,该第三部分图数据包括的该第三节点与该第一部分图数据中包括的第四节点之间具有跨站点边;该第一子计算站点还用于根据该第二匹配指示消息和该查询计划,确定该第四节点是否与该查询计划匹配。

结合上述可能的实现方式,在第三种可能的实现方式中,该主计算站点还用于根据该M个子计算站点的属性,从该M个子计算站点中确定该N个子计算站点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;华为技术有限公司,未经北京航空航天大学;华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510112032.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top