[发明专利]分布式数据库的数据内部传输代价标定方法及系统在审

专利信息
申请号: 202111474595.0 申请日: 2021-12-06
公开(公告)号: CN114218327A 公开(公告)日: 2022-03-22
发明(设计)人: 许晓笛 申请(专利权)人: 浪潮云信息技术股份公司
主分类号: G06F16/27 分类号: G06F16/27;G06F16/22
代理公司: 济南信达专利事务所有限公司 37100 代理人: 孙园园
地址: 250100 山东省济南市高*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分布式 数据库 数据 内部 传输 代价 标定 方法 系统
【说明书】:

发明公开了分布式数据库的数据内部传输代价标定方法及系统,属于数据库技术领域,本发明要解决的技术问题为传统数据库在向分布式数据库转型时,难以估计数据内部传输代价,采用的技术方案为:该方法具体如下:确定数据内部传输代价模型,具体包括:构建数据广播代价模型;构建数据重分布代价模型;构建数据聚集代价模型;标定数据内部传输代价系数:采用TPC‑DS标准测试数据库的数据;具体包括:标定数据广播代价系数;标定数据重分布代价系数;标定数据聚集的代价系数。

技术领域

本发明涉及数据库技术领域,具体地说是一种分布式数据库的数据内部传输代价标定方法及系统。

背景技术

随着信息技术不断深入生活,各种信息系统的数据量呈爆炸式增长,由于单个计算机容量的限制,传统单体数据库已经无法满足大数据场景下对数据库软件的需求,许多单体数据库被改造为了分布式数据库。

分布式数据库相比单体数据库的一个显著区别是:数据分布在多个分布式节点中,在执行数据查询的过程中,可能涉及到三种数据内部传输:广播、重分布、聚集,可能会涉及到大量数据在数据库节点之间的复制或者移动。

在传统单体数据库中,由于没有数据内部传输的过程,所以数据库在查询的计划阶段,不会将数据内部传输的代价考虑在内。而对于分布式数据库来说,数据内部传输会有较大的网络开销,此环节的代价已经无法忽略。传统数据库在向分布式数据库转型时,难以估计数据内部传输代价成了困扰数据库研发工作的难题。

发明内容

本发明的技术任务是提供一种分布式数据库的数据内部传输代价标定方法及系统,来解决传统数据库在向分布式数据库转型时,难以估计数据内部传输代价的问题。

本发明的技术任务是按以下方式实现的,一种分布式数据库的数据内部传输代价标定方法,该方法具体如下:

确定数据内部传输代价模型,具体包括:

构建数据广播代价模型;

构建数据重分布代价模型;

构建数据聚集代价模型;

标定数据内部传输代价系数:采用TPC-DS标准测试数据库的数据;具体包括:

标定数据广播代价系数;

标定数据重分布代价系数;

标定数据聚集的代价系数。

作为优选,数据广播代价模型具体如下:

Cbrod=kbrod·Stable·(Nnode-1);

其中,Cbrod表示数据广播的代价值;kbrod表示数据广播的代价系数;Stable表示数据表的大小;Nnode表示分布式节点个数;数据广播是将分散在各个节点的数据广播至全部节点。

更优地,数据重分布代价模型具体如下:

Cdist=kdist·Stable

其中,Cdist表示数据重分布的代价值;kdist表示数据重分布的代价系数;Stable表示数据表的大小;数据重分布是将数据按照所需的分布规律做从新分布。

更优地,数据聚集模型具体如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111474595.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top