[发明专利]一种在联邦型RDF数据库中查询关键字的方法有效
申请号: | 201810509701.6 | 申请日: | 2018-05-24 |
公开(公告)号: | CN108804580B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 杨宇言;彭鹏;关润宇;邓程;秦拯 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/27;G06F16/22;G06F16/242;G06F16/248 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联邦 rdf 数据库 查询 关键字 方法 | ||
本发明涉及一种在联邦型RDF数据库中查询关键字的方法,其步骤包括:1)通过访问不同RDF数据源提供的SPARQL查询接口,抽象出对应的模式图;2)通过现有SPARQL引擎提供的全文检索接口,找出每个关键字对应的候选类点队列;3)将每个关键字映射到模式图中相应类点上,得到一个有关键字映射的模式图;4)从映射的关键字出发,从模式图中得到若干个不同关键字相连的子结构图;5)为每个子结构图构建对应的SPARQL查询;6)多个SPARQL查询发送到RDF数据源上的SPARQL查询接口得到查询结果。本发明的方法可行且高效,能在可接受时间内计算出在联邦型RDF数据库中的关键字查询结果。
技术领域
本发明涉及分布式RDF数据检索技术领域,主要涉及一种在联邦型RDF数据库中的基于模式图和关键字映射的关键字查询回答方法。
背景技术
RDF(ResourceDescriptionFramework)数据是W3C提出的一种知识表示模型,是用于描述Web资源的标记语言,即“描述数据的数据”。RDF数据利用统一资源标识符标识从网页等信息资源拓展到所有事物,其基本数据单元是一个三元组,即主体,属性,客体。每个单元组表示一个资源的属性值或者某个资源与其他资源的关系。等于我们得到一个大型知识网,里面所有内容都是机器可查询、标准且无歧义。W3C还定义了一种结构化查询语言SPARQL(SimpleProtocolandRDFQueryLanguage)针对大规模RDF数据的查询与管理。SPARQL查询作为一种类SQL查询用于查询满足某种条件下的RDF数据片段。SPARQL查询语句通过RDF数据库提供的SPARQL接口执行并返回结果。
联邦型RDF数据库(FederatedRDFSystem)是将RDF数据储存在若干不同机器上的、各自“自治”的RDF数据源上,这些机器中的子系统按照各自的方式对数据进行管理,并被集成到一个系统平台下。每个包含一定RDF数据集合和SPARQL查询接口的机器称为一个RDF数据源,而这些SPARQL查询接口都从属于“自治”的系统,即能够各自独立地接受SPARQL查询并计算出匹配。当处理一个SPARQL查询时,中心机器对查询进行调度,从而通过各个机器上提供的SPARQL接口找到局部匹配,最后再拼接成最终匹配。
相较于传统单机环境下的RDF数据库,联邦型RDF数据库能更好地应对单机系统性能限制的RDF数据,同时也能更为高效地应对和处理大量SPARQL查询。由于联邦型RDF数据库“自治”且独立,所以它们拥有更好的可拓展性,能够通过增加适当的数据冗余,提供系统的可靠性。
其中,关键字查询是联邦型RDF数据库领域里极为重要的一项需求。例如,用户给定两个关键字,想得出在联邦型RDF数据库的数据集中与这两个关键字有关的实体答案。
尽管已经存在一些前人的工作来讨论RDF数据中的关键字查询方法,但是这些技术通常都是在构建全局性倒排索引的前提下提出,这种方法在联邦型RDF数据库中不具有可操作性,只能支持在单机RDF数据库中实现,可扩展性差。而关于分布式RDF数据库中的关键词查询研究工作几乎没有,在联邦型RDF数据系统中,出于对安全性的考虑,查询处理时不允许在不同数据源之间相互传递数据。即各个子系统不允许互相干涉,用户只能通过各个系统中系统的SPARQL接口对RDF数据进行下载和查询。因此我们也就无法构建一个全局性的倒排索引来实现关键字查询任务。
显然,传统方法难以被用在联邦型RDF数据库的关键字查询这个问题中。
发明内容
本发明提出了一种基于模式图和关键字映射的转化方法,用以对联邦型RDF数据库中的关键字查询进行有效地处理。
本方法中,为了有效地查询关键字,我们为其提出了新的解决方法。查询执行是针对本发明一种在联邦型RDF数据库中执行的关键字查询方法,具体方法如下:
1)访问不同机器上联邦型RDF数据库提供的SPARQL查询接口,抽象构建对应的模式图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810509701.6/2.html,转载请声明来源钻瓜专利网。