[发明专利]一种基于领域本体的油气大数据查询和存储方法在审
| 申请号: | 201910454493.9 | 申请日: | 2019-05-29 |
| 公开(公告)号: | CN110147376A | 公开(公告)日: | 2019-08-20 |
| 发明(设计)人: | 宫法明;马玉辉;唐昱润;袁向兵;李昕;李传涛;李翛然 | 申请(专利权)人: | 中国石油大学(华东) |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/901 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 266580 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 领域本体 数据结构 大数据 存储 分布式存储 存储空间 有向图 构建 油气 查询 动态扩展 非结构化 负载压力 匹配问题 石油领域 数据查询 索引检索 统一表示 映射规则 正常存储 结构化 三元组 五元组 有效地 映射 阻抗 数据库 体内 占用 输出 缓解 | ||
本发明公开了一种基于领域本体的油气大数据查询和存储方法,该方法包含:通过领域本体内的概念及概念间的关系进行形式化统一表示完成本体的构建;以三元组和五元组的数据结构对多个领域中的知识和概念进行形式化的描述,实现RDF有向图非结构化存储;通过建立系列R2G结构化映射规则完成RDF有向图到Neo4j数据结构的映射,然后在Neo4j数据结构的基础上构建Key‑Neo4j分布式存储模型,实现Neo4j数据库的分布式存储;形成了适用于石油领域本体的双层索引检索法,最后输出占用的存储空间大小和数据查询时间,实现了大数据环境下的海量资源的正常存储与动态扩展。本发明的方法能够有效地解决领域本体存储时的阻抗不匹配问题,极大地缓解了存储空间的负载压力。
技术领域
本发明属于计算机油气大数据领域,涉及一种基于领域本体的油气大数据查询和存储方法。
背景技术
石油领域本体对石油勘探开发领域中二十多个学科的知识概念进行了描述,同时表现了概念和属性之间的相互关系。在石油勘探开发工作中,石油本体可以完成石油勘探开发领域中多学科的知识集成和信息集成,阐明术语与术语之间的关系及其领域公理,并对它们进行了形式化描述,该领域本体可以作为一种解决石油领域中多专业之间的知识融合的模式。石油领域本体的特点可以解决石油勘探开发领域中由于多学科而导致的概念之间的不规范性、概念相对独立等问题,将石油领域各个学科之间的知识概念形成一个统一的整体,加快了石油领域电子信息化建设进程。
已有的算法形如三重表法、水平分区和垂直分区等算法,三重表法将整个RDF数据存储到一个三列数据表中,每一行都分别对应RDF数据的主体资源、映射关系和客体资源,三重表法针对于小型规模的数据有着十分优越的性能,但是随着数据规模的增加,会产生大量的自连接,导致数据处理速度效率大幅度降低。水平分区方法是将所有RDF数据存储到一个表中,该表为RDF数据的每个谓词值指定一个专用列,且这个表支持多值属性,但由于稀疏属性导致大量空单元格,所以该存储方法不适用与大规模数据存储。垂直分区方法将三重表重写为n个两列表,其中n是数据中唯一属性的数量,对于指定谓词值的查询来说,执行效率高,但随着数据规模的增加,信息的检索时间将呈指数增长。以往的石油领域本体数据存储量小,选择传统关系型数据库为存储介质可以满足实际的需要,但是,由于大数据时代的到来,数据呈爆炸式进行增长,选择关系型数据库所产生的重复存储,极大地占用了存储资源,冗余的存储模式也给信息的检索带来了极大的困难。因此,如何在数据繁多和极其复杂的关系中,充分地利用领域本体进行准确高效的数据查询和存储成为一个亟待解决的难题。
发明内容
本发明为了克服上述缺陷,提出了一种基于领域本体的油气大数据查询和存储方法,本发明具体步骤如下:
S1,通过领域本体内的概念及概念间的关系进行形式化统一表示,完成本体的构建;
S2,以三元组t=<s,p,o>的数据结构对多个领域中的专业知识和概念进行清晰且形式化的描述;
S3,通过增加元组的数量,由多个RDF三元组数据组合构建五元组O={C,R,At,Rel,Ao}数据模型;
S4,以图结构中的节点表示本体数据中的概念及属性,以两节点之间的边代表本体之中的对应关系,进行RDF有向图非结构化存储;
S5,通过建立系列R2G结构化映射规则,实现RDF有向图到Neo4j数据结构的映射;
S6,在Neo4j数据结构的基础上构建Key-Neo4j分布式存储模型,实现Neo4j数据库的分布式存储;
S7,通过创建对象索引和三元组索引机制,形成适用于石油领域本体的双层索引检索法;
S8,输出占用的存储空间大小和数据查询时间。
本发明的技术方案特征和改进为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910454493.9/2.html,转载请声明来源钻瓜专利网。





