[发明专利]一种有状态集群恢复方法、装置、设备及可读存储介质有效
申请号: | 201811507350.1 | 申请日: | 2018-12-10 |
公开(公告)号: | CN109639794B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 杜鹏飞 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24;H04L29/06;H04L29/12 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 310024 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 状态 集群 恢复 方法 装置 设备 可读 存储 介质 | ||
本发明公开了一种有状态集群恢复方法,该方法包括以下步骤:目标节点重启后,获取分布式协调服务记录的身份标识文件;利用身份标识文件确定主节点身份标识,并判断主节点身份标识与本机标识是否相同;如果是,则获取分布式协调服务的分布式锁,并在本机网卡中设置有状态集群对外提供访问服务的VIP;如果否,则在主节点获取分布式锁后,以从节点身份加入有状态集群,并加入申请主身份队列。可在有状态集群运行时、集群重启时、或单节点重启时,保障有状态集群数据完整性。本发明还公开了一种有状态集群恢复装置、设备及可读存储介质,具有相应的技术效果。
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种有状态集群恢复方法、装置、设备及可读存储介质。
背景技术
在云计算、大数据、人工智能等IT系统中,有很多关键的服务存储着业务的核心数据,它们的正常运行是系统稳定运行的前提,为了解决单点故障和数据丢失问题,一般使用多个节点冗余备份的方法组成一个集群,统一对外提供服务。这些存在可变数据的服务称为有状态服务。如作为数据库服务的Galera技术的mariadb集群、ovn-db的主备集群、mongo主备集群,如作为消息转发服务的rabbitmq-server主备集群。当提供服务的节点异常(如断电、网络异常)之后,其他节点的服务可以继续工作。
多个节点形成有状态集群,每个节点都保存各自的数据,通过集群心跳和同步来保证各个节点的数据一致性。有些集群是多个节点同时提供读写能力,如Galera-Mariadb、rabbitmq-server;有些集群是分为master+slave角色,只有master节点提供读写能力,slave只能提供读能力。在集群恢复方面,上述每种集群都可以轻松解决单点故障和重加入的问题。但是如果集群多个节点异常(如断电、网络震荡),甚至全部异常,又或者计划内整体关机(如处于维护的目的关闭集群)后,再将集群恢复正常,就是比较困难的事情。尤其是在要求全部上电自动恢复的场景时,问题更为突出。具体表现在:集群重启时,最后一个挂掉的节点应该第一个重启,以保证数据是最全最完整的。即,当整体集群重启时,就需要一个仲裁模块抉择哪个节点先启动,这往往取决于集群关闭时的顺序,仲裁模块会通过探测的方式抉择出哪个节点是最后关闭的,然后让该节点先启动,以保证数据完整性(因为最后关闭的节点才会有最完整的数据,提前关闭的节点的数据是有可能不完整的)。如图1所示(启动顺序同图示空心箭头的顺序,与关闭时间顺序相反),常见的如pacemaker通过mariadb的agent启动mariadb集群的方式,就是如此。但是通过额外的Pacemaker模块管理集群的启动和运行有如下缺点:
缺点一:pacemaker本身依赖corosync,而后者在网络震荡时稳定性较差,也增加了系统复杂度。
缺点二:pacemaker管理各个业务模块时需要配置agent,且每个agent的实现各不相同,在业务模块版本升级时,可能出现agent不兼容的情况。
缺点三:pacemaker适合业务模块的原生启动模式,但对于容器化后的业务模块,pacemaker无能为力。
缺点四:pacemaker状态机复杂,且agent的实现和业务模块耦合性很高,造成维护困难。
综上所述,如何有效地解决集群重启时,保障数据完整性等问题,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种有状态集群恢复方法、装置、设备及可读存储介质,以在集群重启时,保障数据完整性。
为解决上述技术问题,本发明提供如下技术方案:
一种有状态集群恢复方法,包括:
目标节点重启后,获取分布式协调服务记录的身份标识文件;
利用所述身份标识文件确定主节点身份标识,并判断所述主节点身份标识与本机标识是否相同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811507350.1/2.html,转载请声明来源钻瓜专利网。