[发明专利]一种高效的RDF数据存储查询系统在审
申请号: | 201811320234.9 | 申请日: | 2018-11-07 |
公开(公告)号: | CN109684325A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 李雯雯;饶国政;张冰怡 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 哈希表 哈希树 存储 查询系统 查询效率 复合索引 第一层 哈希 数据存储查询 存储效率 素数序列 动态的 构建 冲突 应用 | ||
本发明公开了一种高效的RDF数据存储查询系统,所述系统采用哈希表和哈希树的复合索引结构,用于存储RDF数据;所述复合索引结构包括:作为第一层的哈希表的哈希层、以及作为第二层的哈希树的树层;所述哈希层为静态哈希表,所述树层为动态的哈希树,提高了查询效率;在第一层中,构造长度为m的静态哈希表;在第二层中,基于素数序列动态地构建哈希树;所述系统还利用哈希树解决哈希表中的冲突问题。本发明通过设计的数据存储查询系统提高了RDF存储效率和SPARQL的查询效率,满足了实际应用中的多种需要。
技术领域
本发明涉及索引和存储结构领域,尤其涉及一种高效的RDF(资源描述框架)数据存储查询系统。
背景技术
在过去的几十年里,RDF数据量大幅增长,因此,如何有效地存储和管理海量的RDF数据已成为一项巨大的挑战。现已有的几个系统支持RDF存储和查询,如gStore、RDF-3x等。根据数据管理方法,这些系统可以分为三类:基于关系数据库的系统、基于三元组的系统和基于图的系统。
基于关系数据库的系统将RDF数据转换为关系数据表存储,查询时,SPARQL(查询语言和数据获取协议)查询也需要转化为SQL(结构化查询语言)语言。这些系统又可以细分为:基于三列表的系统、基于属性表的系统和基于垂直分区表的系统。在基于三列表的系统中,每行元素代表一个RDF语句,三列分别对应于主语、谓语和宾语。虽然三列表简单易用,但查询效率低,易产生大量的自连接操作。基于属性表的系统按属性(也就是谓词)分组,相同谓词的语句分到一个关系表中。该方法可以有效减少自连接操作的次数,但是,实际上,属性表会产生大量空值,而且,查询还会涉及多个属性表,因此,属性表只适用于某些特殊应用。垂直分区表使用多个双列表存储RDF数据。与属性表相同,垂直分区表也可能导致大量空值。利用关系数据库成熟的管理技术,这类系统易于实现。但是,这类系统破坏了RDF的原始结构,并且容易产生大量的join操作和空值。
基于三元组的系统以三元组原始的形式来存储RDF数据,例如:RDF-3x、RDF Cube等。通常这些系统利用B+树索引、哈希索引或其他索引结构来提高查询性能。例如,RDF-3x根据主谓宾六种不同的组合顺序创建了六种B+树索引以加速查询性能。其基本思想是牺牲空间效率以提高时间效率;RDFCube根据主谓宾建立三维的哈希表用来过滤掉部分无效数据。
基于图的系统将RDF数据看成图数据来处理,更好的保留了RDF的结构特征。例如:在gstore中,RDF数据的查询问题转换为了子图匹配问题。
虽然上面提到的方法已经实现了RDF存储和查询的功能,但是随着数据量的增多,查询速度慢已经成为这类系统的致命弱点。如何在大数据量的情况下,提高RDF存储效率和查询速度,是本发明要解决的问题。
发明内容
本发明提供了一种高效的RDF数据存储查询系统,本发明拟开发一个支持RDF存储和SPARQL查询的系统,旨在提高RDF存储效率和SPARQL查询效率,详见下文描述:
一种高效的RDF数据存储查询系统,所述系统采用哈希表和哈希树的复合索引结构,用于存储RDF数据;
所述复合索引结构包括:作为第一层的哈希表的哈希层、以及作为第二层的哈希树的树层;所述哈希层为静态哈希表,所述树层为动态的哈希树,提高了查询效率;
在第一层中,构造长度为m的静态哈希表;在第二层中,基于素数序列动态地构建哈希树;
所述系统还利用哈希树解决哈希表中的冲突问题。
进一步地,所述系统在执行插入操作时,包括:将RDF顶点直接插入到哈希表的空白桶中;
若哈希表中的对应位置已有数据,则应在第二层中建立新的哈希树;
若哈希树未构建,则创建哈希树的根节点,若已构建,则插入RDF顶点,依次向下判断子节点是否被占用,没有占用时,插入节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811320234.9/2.html,转载请声明来源钻瓜专利网。