[发明专利]图数据搜索系统、方法和设备在审
申请号: | 201510112032.5 | 申请日: | 2015-03-13 |
公开(公告)号: | CN105045790A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | 樊文飞;王欣;吴颖徽 | 申请(专利权)人: | 北京航空航天大学;华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王君;肖鹂 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 搜索 系统 方法 设备 | ||
技术领域
本发明实施例涉及信息技术领域,并且更具体地,涉及图数据搜索系统、方法和设备。
背景技术
很多现实中的计算问题都会涉及到大规模的图。网页链接关系和各种社交关系是这种大规模图的最典型的例子。这些图可能具有大量的顶点以及边。如何对图进行高效率的搜索以获取所需的内容是一项亟待解决的问题。
谷歌(Google)提出的Pregel技术是一种效率较高的图搜索机制。Pregel技术是通过主从结构的系统实现的。在需要对一个特定关系(即查询计划)进行搜索时,主节点(Master)会将保存的完整的图数据进行分区,将完整的图划分为多个子图,并将子图发送给多个从节点(Worker)。每个从节点可以接收一个或多个子图。节点负责维护分配给自己的子图的顶点(vertex)和边(edge)的状态信息。节点为每个子图分配一个线程。该线程根据计算任务对每一个处于激活(active)状态的顶点进行计算,计算完成后,根据边的链接信息,通过消息传递方式将计算结果传递给其它相邻的从节点,直到没有激活状态顶点或者迭代次数达到指定数目。
Pregel中,Master和Worker都是计算站点,Master负责调度Worker进行计算。因此,Pregel存在以下问题:消息传播和计算过程中的大量步骤都是串行化步骤,即必须在一个步骤完成之后再执行下一个步骤;消息传递数量以及总体并行化运行时间等方面很难获得理论上界;消息传递开销会影响图数据搜索的性能。
发明内容
本发明实施例提供图数据搜索系统、方法和设备,提高图数据搜索的效率与可扩展性。
第一方面,提供了一种图数据搜索系统,该系统包括一个主计算站点和M个子计算站点,该M个子计算站点中每个子计算站点均存储总图数据中的部分图数据,该部分图数据包括多个节点和用于连接该多个节点中的两个节点之间的边,其中M为大于1的正整数;其中,该主计算站点用于将查询计划发送给该M个子计算站点中的N个子计算站点,其中该查询计划采用图仿真的查询语义,N为小于或等于M的正整数;该N个子计算站点中的第一子计算站点用于接收该主计算站点发送的该查询计划;该第一子计算站点还用于根据该查询计划,对该第一子计算站点存储的第一部分图数据进行迭代查询,以确定该第一部分图数据包括的多个节点中与该查询计划相匹配的至少一个匹配节点,该至少一个匹配节点组成该第一子计算站点的本地匹配节点集合;该第一子计算站点还用于向该主计算节点发送该第一子计算节点的本地匹配节点集合;该主计算站点还用于接收该N个子计算站点中的每个子计算节点发送的该每个子计算节点的本地匹配节点集合,并且根据该N个子计算站点中的每个子计算节点的本地匹配节点集合,确定对应于该查询计划的匹配结果。
结合第一方面,在第一种可能的实现方式中,该第一子计算站点还用于确定该第一部分图数据中包括的与该查询计划相关的第一节点,其中,该第一节点与第二部分图数据中包括的第二节点之间具有跨站点边,该N个计算子节点中的第二子节点存储有该第二部分图数据;该第一子计算站点还用于向该第二子计算站点发送第一匹配指示消息,该第一匹配指示消息用于指示该第一节点与该查询计划的匹配结果。
结合上述可能的实现方式,在第二种可能的实现方式中,该第一子计算站点还用于接收该N个子计算节点中的第三子计算站点发送的第二匹配指示消息,该第二匹配指示消息用于指示第三站点与该查询计划的匹配结果,其中,该第三子计算节点存储有第三部分图数据,该第三部分图数据包括的该第三节点与该第一部分图数据中包括的第四节点之间具有跨站点边;该第一子计算站点还用于根据该第二匹配指示消息和该查询计划,确定该第四节点是否与该查询计划匹配。
结合上述可能的实现方式,在第三种可能的实现方式中,该主计算站点还用于根据该M个子计算站点的属性,从该M个子计算站点中确定该N个子计算站点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;华为技术有限公司,未经北京航空航天大学;华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510112032.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:有机发光显示装置及电子设备
- 下一篇:一种加固散热模块结构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置