[发明专利]一种适用于增量查询的持久化图索引结构与查询方法在审
申请号: | 202211290217.1 | 申请日: | 2022-10-21 |
公开(公告)号: | CN115544317A | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 秦小麟;朱世彪;王立松;王鑫梦 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 张力 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 增量 查询 持久 索引 结构 方法 | ||
本发明公开了一种适用于增量查询的持久化图索引结构与查询方法,索引结构,包括抽屉和柜子;其中,抽屉用于存放相似元素,包括相同属性相同值的起始顶点以及相同属性不同值的终止顶点组成的边元素;柜子为用于存放与管理抽屉的表结构,其存储具有相同属性不同值的顶点,以及以这些顶点为起始顶点的边抽屉。基于所述的持久化图索引结构实现的查询方法,包括子图匹配查询和增量查询。可提高子图匹配效率和图更新后的子图匹配查询效率,并且降低增量查询的空间开销。
技术领域
本发明属于图数据管理技术领域,具体涉及一种适用于增量查询的持久化图索引结构与查询方法。
背景技术
图数据库的是一种以图这种数据结构存储和管理数据的数据库,在生物化学,软件工程,社交网络以及人工智能等领域被广泛的使用。在现实应用中,图数据被更新后,例如增加或删除数据,往往导致原有查询结果不再可信,需要重新执行查询。在大规模图数据中,对全部数据重新执行一次查询开销巨大。
图数据库的概念是从以下认识演变而来的:在许多应用程序中,连接单个概念的实例的单个关系类型本身可能形成图结构,它的数据模型主要是以顶点与顶点间的边来体现。诸如超文本文档中的链接结构文档连接、地理数据库中的道路连接,以及蛋白质里的化学键连接等连接均可表示为图数据库中的边。大多数数据模型的进一步要求是数据严格符合模型的结构要求。异构数据集成和网络数据中的应用需要更大的灵活性,从而产生了使用图模型进行数据管理的需求。
图数据库及相关查询广泛应用于实际生产过程中:在路径网络中,从位置loc1到位置loc2的旅客可能对具有某些道路约束条件的最短距离路线感兴趣,例如,避开有施工工程的道路,以防止延误,或避开收费道路。最短路径操作只需要查询时指定的图的子集。在社交网络中,有些图分析技术计算两个人之间的最短路径,返回的路径必须使用某些类型的关系(例如,家庭关系)。
现实生活中的图表是不断变化的,相应的,图数据库也需要频繁的更新。数据被更新后往往导致原有查询结果不再可信,需要重新执行查询。首先,对于大规模图数据而言,从头开始重新计算的代价过大。其次,为了响应频繁的更新,数据库的维护开销也不可忽视。此外,对频繁的更新而言,一些用于加速查询的数据库技术,例如索引,也会带来额外的维护成本。因此,如果每当数据更新,对这些数据的查询都需要重新计算,那么查询的成本会过大。
虽然现有数据管理领域存在与增量算法有关的内容,但他们的缺点过于严重:GraphBolt使用依赖图存放图更新的完整过程,使用顶点值表示计算的中间结果。GraphInc将每一轮更新后所有顶点状态与生成的信息存入磁盘。现有的系统必须维护先前计算的中间结果,而巨大的中间结果也可能导致低效率。GraphBolt每次更新产生|V|个新顶点以及
〖|V|〗^2边,这在图更新几乎不间断的社交网络中极易导致内存过载。GraphInc将每次更新后的信息存入磁盘,这将提升IO操作的成本。此外,GraphBolt使用顶点值保存的中间结果的方法,仅适用于图结构的计算,不适用于图查询。GraphBolt和KickStarter要求用户使用提供的API来编写图计算语句,包含各种各样的函数用于更新图的变化,检查顶点属性值的变化以及传播的变化。而基于AFF的方法需要研究者对每个计算或查询提出全新的中间结构,并完成正确性的证明。手动设计增量算法容易出错,很难判断其正确性,同时也不具备通用性。
发明内容
本发明所要解决的技术问题是针对上述现有技术的不足,提供一种适用于增量查询的持久化图索引结构与查询方法,涉及适用增量算法的子图匹配索引,基于抽屉管理实现图索引持久化、基于索引的子图匹配、基于增量查询的子图匹配,以及持久化索引的修改、插入、删除等,可以省略子图匹配查询查询的中间结果,适用于社交网络、交通网络等图数据的高效管理与查询,可提高子图匹配效率和图更新后的子图匹配查询效率,并且降低增量查询的空间开销。
为实现上述技术目的,本发明采取的技术方案为:
一种适用于增量查询的持久化图索引结构,包括抽屉和柜子;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211290217.1/2.html,转载请声明来源钻瓜专利网。