[发明专利]一种分布式存储集群及其节点故障切换方法和装置有效
申请号: | 201810668234.1 | 申请日: | 2018-06-26 |
公开(公告)号: | CN108847982B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 孙业宽 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 存储 集群 及其 节点 故障 切换 方法 装置 | ||
本发明公开了一种分布式存储集群节点断电切换方法及其装置,应用于分布式存储集群的主节点,该方法包括:依据CTDB的心跳检测方式检测集群内的各个节点的状态;检测到断电节点后,获取断电节点的业务信息;将业务信息发送至分布式存储集群中具有相应服务功能的正常节点内,供接收业务信息的各个正常节点依据业务信息进行业务漂移以及业务恢复。本发明将断电节点的检测恢复过程时间由原本的分钟级缩短为秒级,加快集群恢复正常以及断电节点的业务恢复访问的速度,提高集群的可靠性;本发明还公开了一种一种基于上述方法的分布式存储集群。
技术领域
本发明涉及分布式集群高可用技术领域,特别是涉及一种分布式存储集群节点断电切换方法及其装置。本发明还涉及一种分布式存储集群。
背景技术
分布式存储集群是由多个存储节点服务器构成的集群,支持一份数据存储在多个节点上,每个节点通过节点间通信都可以获取到完整的数据,当节点出现宕机时根据配置的策略可以进行完整数据的恢复,分布式存储集群内包括监控模块、存储池模块、元数据管理模块等服务模块。
分布式存储集群在运行过程中部分节点有可能发生电源线松动或电源线被拔掉等故障使节点断电,此时如果断电节点个数在集群允许断电节点数范围内(即集群节点冗余数),分布式存储集群恢复正常并继续提供业务的正常访问需要分钟级的时间,原因是由于目前分布式存储集群是由各个服务模块通过心跳检测确认各个节点是否断电的,而服务模块的心跳检测精度是分钟级的,即60s以上(因为低于60s会导致集群出现震荡),因此,目前需要通过60s以上的时间来确认是否出现节点断电,进而进行集群恢复以及断电节点的业务恢复等。
由此可见,在目前的节点断电检测恢复过程中,集群无法快速检测到断电故障,进而无法无法快速地进行集群恢复以及恢复断电节点上的业务访问,导致业务中断时间长,集群可靠性差。
因此,如何提供一种可靠性高的分布式存储集群节点断电切换方法及其装置以及一种分布式存储集群是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种分布式存储集群节点断电切换方法及其装置,将断电节点的检测恢复过程时间由原本的分钟级缩短为秒级,加快集群恢复正常以及断电节点的业务恢复访问的速度,提高集群的可靠性;本发明的另一目的是提供一种基于上述方法的分布式存储集群。
为解决上述技术问题,本发明提供了一种分布式存储集群节点断电切换方法,应用于所述分布式存储集群的主节点,所述方法包括:
依据CTDB轻量级集群数据库的心跳检测方式检测集群内的各个节点的状态;
检测到有节点断电后,获取断电节点的业务信息;
将所述业务信息发送至所述分布式存储集群中具有相应服务功能的正常节点内,供接收所述业务信息的各个正常节点依据所述业务信息进行业务漂移以及业务恢复。
优选地,检测到有节点断电后,获取断电节点的业务信息之前,还包括:
判断所述断电节点是否是通过心跳检测得到的,若是,则获取所述断电节点的业务信息。
优选地,所述业务信息包括虚拟IP。
优选地,所述业务信息还包括业务缓存数据。
优选地,所述将所述业务信息发送至所述分布式存储集群中具有相应服务功能的正常节点内的过程具体为:
调用所述分布式存储集群内的故障切换程序;
选择包含各个服务功能的正常节点;
将所述业务信息发送至所选择的节点内。
优选地,所述服务功能包括监控功能、存储池功能和元数据管理功能。
优选地,所述依据CTDB心跳检测方式检测节点状态的过程具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810668234.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分布式计算机云计算处理方法
- 下一篇:基于MQTT协议的入侵检测方法