[发明专利]一种基于Blogel的分布式图受限可达性查询处理方法在审
申请号: | 201910567059.1 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110297950A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 高云君;张天明;陈璐;陈刚;浦世亮 | 申请(专利权)人: | 浙江大学;杭州海康威视数字技术股份有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 应孔月 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可达性 受限 索引 查询处理 标志点 查询 最短路径距离 标签集合 顶点计算 中心性 构建 判定 并行技术 并行索引 查询结果 图数据 返回 中介 算法 | ||
本发明公开了一种基于Blogel的分布式图受限可达性查询处理方法。给定海量图数据,利用并行索引技术,本方法能够快速的返回受限可达性查询的结果。本发明基于Blogel分布式图处理框架,利用并行技术,提升DVL索引的构建效率;利用索引判定方法,提升受限可达性查询的效率。本发明先在局部子图中为每个顶点计算中介中心性,将具有最大中介中心性的前k个顶点选为标志点,再构建DVL索引,为每个顶点计算其到标志点的最短路径距离标签集合Dout和标志点到此顶点的最短路径距离标签集合Din。最后本发明在查询阶段提出分布式受限可达性查询算法,利用索引判定方法快速返回查询结果。本发明提出的分布式图受限可达性查询处理效率明显好于现有的方法,提供了最佳的性能。
技术领域
本发明涉及计算机数据库领域中图可达性查询处理技术,特别是涉及一种基于Blogel的分布式图受限可达性查询处理方法。
背景技术
图受限可达性查询是图上最基本的查询处理问题之一。给定一个有向图,查询源点,查询目的点和查询跳数,图受限可达性查询判断查询源点到目的点是否在给定的查询跳数内可达。图受限可达性查询在现实世界中有很多的应用,例如:在社交网络或者电子商务网络中,受限可达性查询有助于判断一个用户对其他用户的影响力;在通信网络中,受限可达性查询可用于推断信息的传播;在交通网络中,受限可达性查询可用于路径规划。
随着大数据时代的到来,真实世界图数据的规模迅速增长,如Facebook有超过18亿的活跃用户,并且在过去几年里用户数量每年增加10%,如此大规模的图数据需要分布式存储在多个数据中心。因此,设计一个具有高效的受限可达性查询处理方法成为了亟需解决的基本问题。为了解决大型图的分布式计算问题,Google提出的以顶点为中心的计算平台Pregel,其计算过程是由一系列被称为“超级步”的迭代组成,在每个超级步中,每个顶点根据接收到的消息,并行执行用户自定义的函数,修改其自身的状态,然后向其他顶点发送消息,以用于下一个超级步的迭代计算。Blogel系统对Pregel进行了优化,其可支持以块(block)为中心的计算模型,进一步提升了分布式框架处理效率。
针对基于Blogel的分布式图受限可达性查询处理方法,一种基本方法是直接在图上进行广度优先搜索。这种方法无需建立索引,但是需要遍历整张图才能得到最终的查询结果,查询时间长。另一种基本方法是将多个数据中心的部分图数据发送到单台机器上,然后利用现有的受限可达性查询方法进行处理。这种方法需要大量的通信开销,受限于单机内存限制,不具有可扩展性。现有的分布式图受限可达性查询算法disDist预先计算跨分区边界点之间的距离作为索引,然后在线构建带权依赖图并利用Dijstra算法计算源顶点与目的顶点之间的最短路径,最后得到查询结果。disDist方法需要在线构建图,在计算最短路径,查询效率较低。本发明的方法利用标志点构建DVL索引,为每个顶点计算其到标志点的最短路径距离标签集合Dout和标志点到此顶点的最短路径距离标签集合Din,在查询阶段提出了分布式受限可达性查询算法,利用索引判定方法提升了受限可达性查询的效率。
发明内容
针对现有技术的不足,本发明提供一种基于Blogel的分布式图受限可达性查询处理方法,该方法基于Blogel分布式计算框架,先在局部子图中为每个顶点计算中介中心性,并将具有最大中介中心性的前k个顶点选为标志点。然后构建DVL索引,为每个顶点计算其到标志点的最短路径距离标签集合Dout和标志点到此顶点的最短路径距离标签集合Din。最后本发明在查询阶段提出了分布式受限可达性查询算法,利用索引判定方法快速返回查询结果。
为了达到上述目的,本发明所采用技术方案如下:一种基于Blogel的分布式图受限可达性查询处理方法,该方法的步骤如下:
(1)在局部子图中为每个顶点计算中介中心性;
(2)用户提交k值;
(3)根据步骤(2)提交的k值,将具有最大中介中心性的前k个顶点选为标志点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;杭州海康威视数字技术股份有限公司,未经浙江大学;杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910567059.1/2.html,转载请声明来源钻瓜专利网。