[发明专利]一种大规模分布式图数据库集群运维管理的方法和系统有效
申请号: | 202211148001.1 | 申请日: | 2022-09-21 |
公开(公告)号: | CN115248826B | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 刘鑫超;汪洋;李丹骥;叶小萌 | 申请(专利权)人: | 杭州悦数科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/27;G06F16/242 |
代理公司: | 杭州创智卓英知识产权代理事务所(普通合伙) 33324 | 代理人: | 刘宏全 |
地址: | 311100 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 大规模 分布式 数据库 集群 管理 方法 系统 | ||
1.一种大规模分布式图数据库集群运维管理的方法,其特征在于,所述方法包括:
构建控制平面,在所述控制平面导入分布式图数据库集群,通过ssh连接信息将所述控制平面连接到资源平面对应的分布式图数据库集群节点上,具体地,控制平面与资源平面通过Nebula-Agent进行通信,其中,控制平面负责整个集群的服务监控与告警以及运维指令的批量下发;资源平面以服务器节点为单位,负责运行图数据库服务,采集图数据库节点对应的监控指标以及响应控制平面下发的运维指令;
通过对应节点上的Nebula代理服务组件获取分布式图数据库集群的监控指标数据,上报到所述控制平面的prometheus组件进行图数据服务监控,向prometheus组件发送prometheus查询语言语句使监控数据显示并渲染于所述控制平面的监控显示页面上,其中,在通过监控显示页面监控分布式图数据库集群时,当监控到集群负载很高,或者业务流量激增时,通过任务接口在节点上批量下发Execute指令到所述Nebula代理服务组件,增加新的节点资源来扩容集群,并通过平衡图数据指令,将图数据库空间内的分片均匀的分布到新的节点上,来分担分布式图数据库集群各个节点间的访问压力;并在流量高峰过后,多个节点长时间空闲时,对空闲的节点批量下发Execute指令进行缩容;在批量下发指令时,若指令执行失败,则通过Rollback指令进行回滚操作,返回上一步操作;
向prometheus组件发送prometheus查询语言语句使监控数据显示并渲染于所述控制平面的监控显示页面上包括:
定期获取图数据库集群的图空间作业管理数据并显示于监控页面,通过NebulaGraph查询语言对图空间作业管理数据进行远程执行和信息查看,并停止和恢复图数据库集群图空间作业管理中的相关接口;其中,控制面板会定期查看当前正在运行的所有图空间作业;所述图空间作业是在存储服务上长期运维的任务。
2.根据权利要求1所述的方法,其特征在于,所述通过对应节点上的Nebula代理服务组件获取分布式图数据库集群的监控指标数据,上报到所述控制平面的prometheus组件进行图数据服务监控包括:
Nebula代理服务组件通过向对应节点的各个图数据库服务定时发送http请求的方式采集图数据库的监控指标数据,并根据IP-端口-组件的结构打上标签;
所述控制平面将Nebula代理服务组件配置到prometheus组件的采集目标中,pormetheus定时向Nebula代理服务组件获取采集到的各节点的监控指标数据,并进行汇总和存储,其中,所述标签用于区分不同的节点和服务。
3.根据权利要求1所述的方法,其特征在于,在通过监控显示页面监控分布式图数据库集群时,所述方法包括:
当分布式图数据库集群出现故障时,通过所述控制平面向所述Nebula代理服务组件下发批量起停的运维指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州悦数科技有限公司,未经杭州悦数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211148001.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种西格列汀二甲双胍片及其制备方法
- 下一篇:过共析弹簧钢盘条及其制造方法