[发明专利]一种基于互联网的共享数据查询方法无效
申请号: | 201310459747.9 | 申请日: | 2013-09-29 |
公开(公告)号: | CN103605655A | 公开(公告)日: | 2014-02-26 |
发明(设计)人: | 王萌;唐新来;李健军 | 申请(专利权)人: | 柳州市宏亿科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广西南宁汇博专利代理有限公司 45114 | 代理人: | 邓晓安 |
地址: | 545006 广西壮族自治区*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 互联网 共享 数据 查询 方法 | ||
技术领域
本发明涉及信息检索领域,尤其涉及一种基于互联网的共享数据查询方法。
背景技术
互联数据由大量的互联RDF(资源描述框架)图组成。互联数据有四个规则:(1)用URI作为事物的名字;(2)使用HTTP URI;(3)在RDF中提供有用的信息;(4)可以包括到其他URI的RDF链接。互联数据被看做是互联网上的一个开放的分布式的数据库。互联数据可以用RDF数据集来表示,RDF数据集是一个RDF命名图的集合。RDF图既可以表示成RDF三元组(s,p,o)的集合,又可以表示成带标签的有向图
要对海量的互联数据进行处理和应用,首先要解决互联数据的查询问题。W3C推荐使用SPARQL进行语义web数据的查询。RDF的数据格式是带标签的有向图,因此SPARQL是一种图匹配查询语言。SPARQL其语法类似于SQL,SPARQL查询由三部分组成。模式匹配部分,结果修正部分和结果输出部分。SPARQL查询的结果类型包括:是与否,匹配模式的变量值以及由这些值组成的新的RDF数据,资源的描述等。
由于RDF是一种带标签的有向图,人们已经越来越意识到,对以树形和图结构的数据(如XML和RDF),导航能力是非常重要的。然而SPARQL在导航方面提供的支持非常少,这就造成了一些查询的困难。因此我们考虑使用路径表达式来提供查询的导航能力。
发明内容
为解决上述问题,本发明提供一种导航能力强的基于互联网的共享数据查询方法。
为了达到上述目的,本发明采用的技术方案是:一种基于互联网的共享数据查询方法,其特征在于,步骤如下:
(1)导航代理创建数据集导航的基础图;
(2)用户向导航代理输入路径表达式;
(3)导航代理根据路径表达式,迭代的进行转移、跳转、寻找等操作,具体操作步骤为:
第一步:对所述查询计划进行分割,得到由各数据节点分别执行的切片;
第二步:各数据节点分别进行切片处理,得到各数据节点的哈希连接;
第三步:各数据节点通过聚合汇总数据流动操作,在控制节点进行哈希聚合,得到查询结果集;
在所述第二步中,各数据节点的切片处理包括以下步骤:
步骤1)一个数据节点扫描第一表,得到第一哈希表,然后扫描;
第二表,与第一哈希表进行哈希连接,得到第一数据集;
步骤2)另一个数据节点扫描第三表,得到第三哈希表,然后扫描第四表,与第三哈希表进行哈希连接,得到第二数据集;
步骤3)所述另一个数据节点基于所述第一数据集和所述第二数据集进行哈希连接。
在所述第二步中,各数据节点的切片处理包括以下步骤:
步骤11)一个数据节点扫描第一表,得到第一哈希表,然后扫描第二表,与第一哈希表进行哈希连接,得到第一数据集,并将第二表通过广播数据流动操作或者重新分布数据流动操作,发送给其他数据节点;
步骤12)另一个数据节点扫描第三表,基于接收到的所述第二表和扫描的第三表,得到第三哈希表,然后扫描第四表,与第三哈希表进行哈希连接,得到第二数据集;
步骤13)所述另一个数据节点基于所述第一数据集和所述第二数据集进行哈希连接;
(4)导航代理将获得的互联数据结果输出给用户。
更进一步,所述的导航代理为编程语言架构的数据管理服务器。
本发明的发明思想在于:用户根据想要查询的互联数据内容,向导航代理提交用RPath语言描述的路径表达式规则,以及互联数据导航开始的节点等约束条件。
导航代理,是基于路径表达式的互联数据查询与推理引擎,它能够自动的在互联数据上查询出用户想要的内容,并可以根据用户提供的推理规则进行推理。导航代理根据步骤(2)给定的路径表达式,从给定起点集合开始,在互联网上的数据集导航的基础图寻找匹配的路径,进行导航过程,获取查询和推理结果。
RPath语言包括如下规则:
Step:从(g,m)到(g,n)的图内转移,使得对于一些三元组t∈g,m,n∈Term(t),记作(g,t)。其中g表示图,m,n表示图中的节点,t表示一个三元组,Term(t)表示一条互联数据三元组。Self是一种特殊的Step,它的起始节点是同一个节点,即是自身到自身的跳转;
Jump:从(g,n)到(g’,n)的跨图转移,表示从图g跳转到图g’,记作(g,(n,JUMP,g’))。其中g和g’表示两个图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于柳州市宏亿科技有限公司,未经柳州市宏亿科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310459747.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置