[发明专利]一种基于邻接节点树的网络图索引方法无效

专利信息
申请号: 201210063543.9 申请日: 2012-03-12
公开(公告)号: CN102662974A 公开(公告)日: 2012-09-12
发明(设计)人: 贝毅君;徐俊;干红华;刘二腾 申请(专利权)人: 浙江大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 胡红娟
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 邻接 节点 网络图 索引 方法
【说明书】:

技术领域

本发明属于信息检索及其数据库结构技术领域,特别是涉及一种在大型网络图中基于邻接节点树的子图查询方法。

背景技术

图是计算机科学中的重要数据结构。随着信息技术地不断发展,出现了越来越多的数据以图作为逻辑表达,例如生物网络、化学分子结构式、社会网络以及蛋白质网络等等。这些图数据本身包含的数据量也在不断增大,例如每天有4,000个新的化学结构被加入到SCF Finder数据库中。特别的,当前社会网络图中的节点数目已达上亿。因此如何有效地管理和挖掘海量的图数据是图数据库研究的核心问题。具体包括:1)如何建立有效的存储机制和索引策略;2)如何快速有效地在大型网络图中进行查询;3)如何从海量的图数据库中挖掘出有用的信息。随着社会网络等复杂网络图的出现,给定查询图,如何在一个大型图中找到与查询图匹配的所有子图变得非常有意义。例如,通过子图匹配方式可以找到社会网络中的特定朋友圈,以及生物网络中的功能团等。

目前已存在一些要通过子图索引技术来解决大型网络图中子图匹配的查询方法。这些方法主要基于邻接特征的策略,利用节点间的结构信息或节点间的最短路径作为索引结构,以减少匹配代价和搜索时间。然而,在利用邻接属性或路径作为索引单元来剪枝无效节点时,很容易丢失节点周围的结构信息。与此同时,部分伪有效节点可能作为候选节点被保留而需要进一步过滤。此外,相较于树或子图这样较为复杂的结构,仅基于节点间路径等信息在匹配过程中需要更多的连接操作。如公开号为CN102254012A的发明专利提出了一种基于外存的图数据存储方法及子图查询方法,该方法通过对图数据格式统一为一种标准图数据格式,然后根据图数据中每条边的起点和终点的标签信息,对图中的边进行分类存储并对每类边建立B+-Tree索引,按照图数据中每个点上的标签信息,将图中的点划分为若干域,同一域中每一点按标识符顺序依次对应于一位;然后根据边的起点、终点标签信息,为每一类边建立一位图索引;对每一类边建立一起点信息数据直方图和一终点信息数据直方图。其中关于子图查询,首先对查询子图进行分解,然后将分解出的子模块进行查询并将查询结果进行整合。该发明步骤复杂,运算量大,效率不高。

由于基于节点间路径等信息进行节点过滤和匹配并非有效的子图查询方法,因而针对社会网络图的结构特点,有必要提供一个可利用节点间更加复杂的结构信息进行索引并提高子图查询效率的方法。

发明内容

本发明针对目前子图查询中操作复杂,容易丢失节点周围的结构信息等问题,提出一种可利用节点间更加复杂的结构信息进行索引并提高子图查询效率的方法。

一种基于邻接节点树的网络图索引方法,包括步骤:

(1)、根据网络图节点间的邻接关系,建立网络图的邻接节点树索引,根据查询图节点间的邻接关系,分解查询图;

(2)、将网络图中与查询图节点标签相同的节点集合作为查询图节点的初始匹配候选集;

(3)、通过剪枝获得每一个查询图节点对应的节点匹配候选集;

(4)、采用邻接节点树集的覆盖策略实现子图匹配。

所述步骤(1)包括步骤:

采用深度优化方法将网络图的邻接点树进行模式标准化,并使用树字符串方式表示邻接节点树,根据图节点间的邻接关系分别建立网络图和查询图的哈希标签表、逐层特征表以及边列表,并以此为基础构建邻接节点树索引;

采用深度优化方法将查询图的邻接点树进行模式标准化,并使用树字符串方式表示邻接节点树,根据图节点间的邻接关系建立查询图的哈希标签表、逐层特征表以及边列表。

假设v是查询图中的节点,u是节点v的初始匹配候选集中的节点,所述步骤(3)包括步骤:

3.1)、比较v和u的相邻节点标签表,设节点v的中有标签为X的邻接节点数为nv,如果节点u没有标签为X的邻接节点或者邻接节点数小于nv,则从初始匹配候选集中剔除u,并转入步骤3.4),否则,继续下面步骤3.2);

3.2)、查询节点v和u的逐层特征表,比较相同层时边的数量,设边相对于节点v和u的层为k时,具有某相同边e的数量分别为count(e,v)、count(e,u),如果count(e,v)小于count(e,u),则从初始匹配候选集中剔除u,并转入步骤3.4),否则,继续下面步骤3.3);

3.3)、比较节点v和u邻接节点树的字符串,如果节点u的字符串不能包含节点v的字符串,则从初始匹配候选集中剔除u;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210063543.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top