[发明专利]一种高效的RDF数据存储查询系统在审

专利信息
申请号: 201811320234.9 申请日: 2018-11-07
公开(公告)号: CN109684325A 公开(公告)日: 2019-04-26
发明(设计)人: 李雯雯;饶国政;张冰怡 申请(专利权)人: 天津大学
主分类号: G06F16/22 分类号: G06F16/22
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 李林娟
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 哈希表 哈希树 存储 查询系统 查询效率 复合索引 第一层 哈希 数据存储查询 存储效率 素数序列 动态的 构建 冲突 应用
【说明书】:

发明公开了一种高效的RDF数据存储查询系统,所述系统采用哈希表和哈希树的复合索引结构,用于存储RDF数据;所述复合索引结构包括:作为第一层的哈希表的哈希层、以及作为第二层的哈希树的树层;所述哈希层为静态哈希表,所述树层为动态的哈希树,提高了查询效率;在第一层中,构造长度为m的静态哈希表;在第二层中,基于素数序列动态地构建哈希树;所述系统还利用哈希树解决哈希表中的冲突问题。本发明通过设计的数据存储查询系统提高了RDF存储效率和SPARQL的查询效率,满足了实际应用中的多种需要。

技术领域

本发明涉及索引和存储结构领域,尤其涉及一种高效的RDF(资源描述框架)数据存储查询系统。

背景技术

在过去的几十年里,RDF数据量大幅增长,因此,如何有效地存储和管理海量的RDF数据已成为一项巨大的挑战。现已有的几个系统支持RDF存储和查询,如gStore、RDF-3x等。根据数据管理方法,这些系统可以分为三类:基于关系数据库的系统、基于三元组的系统和基于图的系统。

基于关系数据库的系统将RDF数据转换为关系数据表存储,查询时,SPARQL(查询语言和数据获取协议)查询也需要转化为SQL(结构化查询语言)语言。这些系统又可以细分为:基于三列表的系统、基于属性表的系统和基于垂直分区表的系统。在基于三列表的系统中,每行元素代表一个RDF语句,三列分别对应于主语、谓语和宾语。虽然三列表简单易用,但查询效率低,易产生大量的自连接操作。基于属性表的系统按属性(也就是谓词)分组,相同谓词的语句分到一个关系表中。该方法可以有效减少自连接操作的次数,但是,实际上,属性表会产生大量空值,而且,查询还会涉及多个属性表,因此,属性表只适用于某些特殊应用。垂直分区表使用多个双列表存储RDF数据。与属性表相同,垂直分区表也可能导致大量空值。利用关系数据库成熟的管理技术,这类系统易于实现。但是,这类系统破坏了RDF的原始结构,并且容易产生大量的join操作和空值。

基于三元组的系统以三元组原始的形式来存储RDF数据,例如:RDF-3x、RDF Cube等。通常这些系统利用B+树索引、哈希索引或其他索引结构来提高查询性能。例如,RDF-3x根据主谓宾六种不同的组合顺序创建了六种B+树索引以加速查询性能。其基本思想是牺牲空间效率以提高时间效率;RDFCube根据主谓宾建立三维的哈希表用来过滤掉部分无效数据。

基于图的系统将RDF数据看成图数据来处理,更好的保留了RDF的结构特征。例如:在gstore中,RDF数据的查询问题转换为了子图匹配问题。

虽然上面提到的方法已经实现了RDF存储和查询的功能,但是随着数据量的增多,查询速度慢已经成为这类系统的致命弱点。如何在大数据量的情况下,提高RDF存储效率和查询速度,是本发明要解决的问题。

发明内容

本发明提供了一种高效的RDF数据存储查询系统,本发明拟开发一个支持RDF存储和SPARQL查询的系统,旨在提高RDF存储效率和SPARQL查询效率,详见下文描述:

一种高效的RDF数据存储查询系统,所述系统采用哈希表和哈希树的复合索引结构,用于存储RDF数据;

所述复合索引结构包括:作为第一层的哈希表的哈希层、以及作为第二层的哈希树的树层;所述哈希层为静态哈希表,所述树层为动态的哈希树,提高了查询效率;

在第一层中,构造长度为m的静态哈希表;在第二层中,基于素数序列动态地构建哈希树;

所述系统还利用哈希树解决哈希表中的冲突问题。

进一步地,所述系统在执行插入操作时,包括:将RDF顶点直接插入到哈希表的空白桶中;

若哈希表中的对应位置已有数据,则应在第二层中建立新的哈希树;

若哈希树未构建,则创建哈希树的根节点,若已构建,则插入RDF顶点,依次向下判断子节点是否被占用,没有占用时,插入节点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811320234.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top