[发明专利]一种基于MinDFA的联邦型RDF系统属性路径查询与优化方法在审
申请号: | 202110758342.X | 申请日: | 2021-07-05 |
公开(公告)号: | CN113377810A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 葛宁超;秦拯;彭鹏;李明道 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2455 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 mindfa 联邦 rdf 系统 属性 路径 查询 优化 方法 | ||
本发明涉及一种基于MinDFA的联邦型RDF系统属性路径查询与优化方法。其发明内容主要包括(1)基于Thompson算法的联邦型RDF系统属性路径查询属性路径表达式MinDFA快速构建方法;(2)基于MinDFA和B‑DFS的属性路径查询执行方法。
技术领域
本发明涉及分布式RDF系统数据管理与应用领域,一种基于MinDFA的联邦型RDF系统属性路径查询与优化方法。
背景技术
随着信息时代的高速发展和5G网络的形成,网络资源规模日益增大,网络资源之间相互关联形成了天然的数据语义网络。为了形式化描述这些Web资源,2004年,W3C提出了资源描述框架(Resource Description Framework,RDF)的概念,它主要用来描述比如网页的标题、作者、修改日期、内容以及版权信息。在RDF数据概念模型中,网络资源的命名方式采用统一资源标识(Uniform Resource Indentifiers,URI)进行命名,它的数据基本形式为主体,谓词,客体和主体,属性,属性值的三元组,如:张三,朋友,李四表示张三有一个朋友是李四,张三,年龄,30表示张三的年龄属性值为30。若干RDF三元组共同组成一个RDF数据集,为了对构建好的RDF数据集进行数据管理,2008年,W3C提出了针对RDF数据集的结构化标准查询语言SPARQL(Simple ProtocolAnd RDF Query Language)1.0。该查询语言的形式与关系型数据库的SQL类似,使用SELECT关键字查询满足WHERE条件下的RDF数据。由于W3C的大力推广和RDF特有的灵活性结构,不局限于网络资源数据,越来越多的领域数据也被表示为RDF形式。随着RDF数据集规模的日益增长,集中式RDF系统的单机处理能力已彰显出性能不足的特点,采用分布式数据系统对其进行查询处理成为当前研究热点。
联邦型RDF系统作为分布式RDF数据系统中比较新颖的一类,它由一个控制站点和一系列各自“自治”的RDF数据源组成。这些RDF数据源的更新、维护由它们各自的数据管理员独自管理,仅对外提供SPARQL查询接口,不会暴露数据集的所有数据,一定程度上确保了数据的安全性。控制站点负责面向用户交互,将用户提交的联邦查询分发到对应的RDF数据源上进行RDF数据的SPARQL查询。由于SPARQL查询语言的设计初衷只针对集中式RDF系统有效,不能直接应用在联邦型RDF系统,因此联邦型RDF系统的SPARQL查询需要一定的处理转换。针对用户提交一个SPARQL查询,控制站点首先分析联邦SPARQL查询语句,将其分解为多个子查询。然后,将这些子查询分发到相应的RDF数据源上。最后,所有子查询的执行结果返回到控制站点并进行join操作形成最终结果返回给用户。
2013年SPARQL 1.1的发布新增了许多复杂查询方式,其中新增的属性路径查询能够查询数据集中满足属性路径表达式规则的顶点对,这些属性路径表达式规则往往需要复杂的转换才能用基础查询替代,甚至难以使用基础查询替代,然而这些复杂查询的使用需求日益增强,目前,已有的联邦型RDF系统主要实现了SPARQL 1.0中的基础查询和多查询,并对其进行了一些优化,但尚未实现SPARQL 1.1中的复杂查询;因此,针对上述问题,本发明提出了一种基于MinDFA的联邦型RDF系统属性路径查询与优化方法,在联邦型RDF系统中实现了SPARQL 1.1中属性路径查询,并通过相关优化策略提升了查询效率。
发明内容
本发明旨在解决联邦型RDF系统尚未实现SPARQL 1.1中属性路径查询的问题。
为此,本发明提出了一种基于MinDFA的联邦型RDF系统属性路径查询与优化方法,主要包括两个内容:
(1)基于Thompson算法的联邦型RDF系统属性路径查询属性路径表达式MinDFA快速构建方法;
(2)基于MinDFA和B-DFS的属性路径查询执行方法。
具体内容如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110758342.X/2.html,转载请声明来源钻瓜专利网。