[发明专利]一种基于超图划分的分布式数据库及其集群分区方法有效
申请号: | 201610656475.5 | 申请日: | 2016-08-11 |
公开(公告)号: | CN106294757B | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 管海兵;陈文康;马汝辉;李健 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/21 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于超图划分的分布式数据库及其集群分区方法,涉及大数据环境下的数据库的数据放置技术,包括:数据统计模块、历史数据分析模块和数据迁移模块,其中事务访问集存储在原始的文本和日志文件数据中,算法模块集存储平台集成算法模块的数学建模和算法求解;数据分析模块由两个过程组成,日志读取解析过程和数据建模与算法求解过程。数据分析模块中的日志读取解析过程用于管理用户日志上传、预处理和格式转换,生成解析后的事务日志;调度模块有序调度建模、算法、数据迁移,并分析计算结果重新分区。本发明实现了市场需求和日志分析、算法模块的结合,可高效地调整平台的数据放置和分区;提高了数据库的可扩展性、可维护性。 | ||
搜索关键词: | 一种 基于 超图 划分 分布式 数据库 及其 集群 分区 方法 | ||
【主权项】:
1.一种基于超图划分的分布式数据库,其特征在于,包括平台基础层和算法建模层,所述平台基础层包括数据统计模块、历史数据分析模块和数据迁移模块,其中:所述数据统计模块被配置为在数据库运行一段时间后,通过网络连接接收数据库集群的日志统计数据,并进行建模、预处理、噪声去除;所述历史数据分析模块被配置为将所述数据统计模块统计的数据建模,形成了一个集群间的超图模型,将分区的问题抽象成一个图,再通过贪心算法分析出重分区方案和迁移计划,其中,所述超图模型的点是分区,边是每一条事务,边的权值是事务访问的频率;所述数据迁移模块被配置为以历史数据分析模块生成的迁移计划和数据统计模块解析的日志统计数据作为输入,在数据库集群各个机器之间迁移数据;所述算法建模层包括超图最小割模块、复杂网络社团发现模块和日志统计模块,其中:超图最小割模块被配置为对超图进行建模和重分区;复杂网络社团发现模块被配置为通过发现日志统计数据的内在关系的社团属性,并将相同社团属性的日志统计数据放入相应的机器中;日志统计模块被配置为通过对输入日志对象中不同维度的统计,产生日志统计数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610656475.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种车身控制模块
- 下一篇:一种设有多规格预留板的电气控制柜