[发明专利]一种基于SQL与图计算交互式分析的查询方法和系统在审
申请号: | 201811383695.0 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109684349A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 程学旗;王征;郑天祺;张志斌;郭嘉丰 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/245 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图计算 查询 算法 交互式分析 原始节点 最终结果 结构化查询语句 数据处理与分析 迭代终止条件 标准结构化 关系型数据 查询结果 查询语句 查询语言 迭代计算 数据结构 节点表 节点集 触发 嵌入 数据库 筛选 输出 转换 更新 | ||
本发明涉及一种基于SQL与图计算交互式分析的查询方法和系统,包括:根据标准结构化查询语句对数据库中的节点表和边表进行筛选,得到原始节点集和原始边集,根据类结构化查询语句涉及的图计算算法将原始边集转换为图计算算法所需数据结构,原始节点集和原始边集进行连接查询的迭代计算,不断更新节点集,直至算法的迭代终止条件触发,从而得到图计算的最终结果,并将最终结果作为查询结果输出。本发明在已有的关系型数据查询语言SQL中嵌入图查询与图计算方法,既可发挥SQL数据处理与分析的优势,又可进行图查询与计算。
技术领域
本发明涉及数据库系统领域,特别涉及一种基于SQL与图计算交互式分析的查询方法和系统。
背景技术
近年来在数据库领域,统一标准的查询语言是结构化查询语言(StructuredQuery Language)简称SQL。SQL是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统;同时也是数据库脚本文件的扩展名。结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相同的结构化查询语言作为数据输入与管理的接口。结构化查询语言语句可以嵌套,这使它具有极大的灵活性和强大的功能。
在图数据库领域还没有统一的查询标准,日前比较流行的图查询语言包括:Cypher、Gremlin与SPARQL等。
Cypher是一种声明式图查询语言,表达高效查询和更新图数据库。Cypher 是相对简单的查询语法,书写直观可以不用编写复杂的查询代码即可实现对图数据库的操作。目前主要应用于Neo4J图数据库。
Gremlin是Apache TinkerPop框架下的图遍历语言。Gremlin是一种函数式数据流语言,可以使得用户使用简洁的方式表述复杂的属性图(property graph)的遍历或查询。每个Gremlin遍历由一系列步骤(可能存在嵌套)组成,每一步都在数据流(data stream)上执行一个原子操作。Gremlin查询的本质是图遍历,擅长解决求图的直径、点到点之间的路径。
SPARQL(SPARQL Protocol and RDF Query Language),是为RDF开发的一种查询语言和数据获取协议,它是为W3C所开发的RDF数据模型所定义,但是可以用于任何可以用RDF来表示的信息资源。SPARQL构建在以前的RDF查询语言(例如rdfDB、RDQL和SeRQL)之上,拥有一些有价值的新特性。SPARQL的查询与RDF是一致的,RDF是图,SPARQL查询是子图匹配。
当前现有的技术存在着不同的问题:
1)标准SQL难以表达复杂的图查询与图分析算法。标准的SQL擅长对数据进行预处理与后处理,同时可以进行简单的图查询算法,但是效率低下,且无法表达图分析算法,如PageRank、连通子图等算法。
2)现有的图查询方法和语言一般是基于某一种图数据库,比如Cypher是基于Neo4J图数据库,这种方法直接舍弃了传统的关系型数据库,并且放弃了 SQL查询的巨大优势,无法使用SQL进行分析和数据处理。
发明内容
本发明的目的是解决上述现有技术无法通过SQL查询接口进行图查询与图计算算法,提出了一种基于SQL与图计算交互式分析的查询方法,从而设计了与SQL查询引擎可以无缝对接的Loop Join查询引擎,并且设计了一种具体的类SQL查询接口可以进行图分析计算。
具体地说,本发明公开了一种基于SQL与图计算交互式分析的查询方法,其特征在于,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811383695.0/2.html,转载请声明来源钻瓜专利网。