[发明专利]一种新型图数据库的存储内图划分方法在审

专利信息
申请号: 202110493912.7 申请日: 2021-05-06
公开(公告)号: CN113282774A 公开(公告)日: 2021-08-20
发明(设计)人: 陈仁海;王浩;冯志勇 申请(专利权)人: 天津大学深圳研究院
主分类号: G06F16/51 分类号: G06F16/51;G06F16/53
代理公司: 北京国序知识产权代理有限公司 11895 代理人: 朱婷婷;周恺丰
地址: 518063 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 新型 数据库 存储 划分 方法
【说明书】:

发明公开一种新型图数据库的存储内图划分方法,包括步骤:在进行图存储时,首先对目标图形基于大图中各顶点间的关系进行小图划分实现图形分区,然后将数据传输到SSD存储,使围绕目标中心顶点的相同深度的顶点的数据存储同一SSD页面中。本发明基于大图中各顶点间的关系进行小图划分,将围绕中心顶点的深度的顶点尽可能多地存储在同一闪存页面中,从而有效地减少了读取时间和要搜索的数据大小。

技术领域

本发明涉及RDF数据储存技术领域,特别是涉及一种新型图数据库的存储 内图划分方法。

背景技术

随着计算机和网络技术的快速发展,信息系统的数量和规模越来越大,网 络数据正在以一种前所未有的速度被采集和存储,计算机系统需要对大规模的 数据进行存储和管理。资源描述框架(Resource Description Framework,RDF)作 为支持数据语义描述的一种统一标准的数据模型,在数据表示、数据交换及系 统框架支撑方面提供了很好的技术支撑。目前在电子商务、搜索引擎及社交网 络等应用中都得到了很好的应用。随着大规模格式的数据的产生,对大规模数 据的存储、查询及分析方法提出了新的挑战。

RDF在存储方法方面,面对呈现爆炸式海量数据的增长趋势,传统的关系 型数据库越来越难以支撑。传统的关系型数据库在存储和查询方面,无法跟上 当今数据的增长的步伐。于是许多研究提出了将RDF在本地按照图格式进行存 储。这些方法通常采用邻接表作为基本构建来存储和处理数据块。此外,通过 使用复杂索引,如gStore,BitMat和TripleBit或通过使用图探索的方法,如 Trinity.RDF。图储存系统作为非关系型数据库逐渐的超越了关系型数据库。这是 因为当今数据呈现出越来越强的非结构型和可变形性。这些都阻碍了传统关系 型数据库的发展。

但在传统的以顶点为中心的系统中,将数据存储在SSD上时,它被用作黑 匣子。图存储系统在划分图时是无组织的,但会以粗粒度方式将顶点分布到不 同的分区,而无需深入分析不同顶点之间的关系以及读取顶点数据的效率,,数 据可能存储在SSD的不同页面中。因此,访问无法有效利用SSD的特性和内部 并行性。当查询该顶点及其相邻顶点的某些数据时,需要读取多个页面,然后 在这些页面中查找数据并合并查询结果,这是非常低效的。

发明内容

本发明的目的是针对现有技术中存在的技术缺陷,而提供一种新型图数据 库的存储内图划分方法。

为实现本发明的目的所采用的技术方案是:

一种新型图数据库的存储内图划分方法,包括步骤如下:

在进行图存储时,首先对目标图形基于大图中各顶点间的关系进行小图划 分实现图形分区,使围绕目标中心顶点的相同深度的顶点的数据存储同一SSD 页面中,然后将数据传输到SSD存储在深度一致的同一SSD页面中。

优选的,所述对目标图形进行分区时,首先是区分边缘图,然后再进行其 它图的划分。

优选的,如果一个顶点的入度值为0,则将该顶点作为缘图的中心顶点进行 边缘图的区分。

优选的,完成边缘图划分后,设置选择顶点的深度值和出度值,将满足条 件的顶点选出并视为中心顶点保存;若已被其他顶点包含,则删除;

根据深度值及出度值划分图之后,计算形成的子图中包含的顶点数量;

选择子图中包含的顶点数量值大的顶点作为目标中心顶点进行图形划分分 区用于存储。

本发明基于大图中各顶点间的关系进行小图划分,将围绕中心顶点的深度d 的顶点尽可能多地存储在同一闪存页面中,从而有效地减少了读取时间和要搜 索的数据大小。

附图说明

图1为本发明提供的一种闪存页图;

图2为要存储划分的RDF图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学深圳研究院,未经天津大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110493912.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top