[发明专利]处理至少一个分布式集群中的故障的方法、设备和系统有效
申请号: | 201510068053.1 | 申请日: | 2015-02-10 |
公开(公告)号: | CN105991325B | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 袁健清;倪绍基 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L1/22 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 毛威;肖鹂 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种处理至少一个分布式集群中的故障的方法、设备和系统,至少一个分布式集群包括第一分布式集群,第一分布式集群中包括第一Master节点和第一Slave节点,第一参考节点,以及作为第一Master节点的备份的第一备用节点,第一备用节点接收第一参考节点发送的包括用于指示第一参考节点与第一Master节点处于失联状态的第一指示信息的心跳消息;第一备用节点根据第一指示信息,确定第一参考节点与第一Master节点处于失联状态;第一备用节点在检测到第一Master节点向第一备用节点发送的心跳消息中断的情况下,确定第一备用节点与第一Master节点也处于失联状态;第一备用节点确定该第一Master节点发生故障。在本发明实施例中,能够有效缩短故障检测时间。 | ||
搜索关键词: | 处理 至少 一个 分布式 集群 中的 故障 方法 设备 系统 | ||
【主权项】:
1.一种处理至少一个分布式集群中的故障的方法,所述至少一个分布式集群包括第一分布式集群,所述第一分布式集群中包括第一Master节点和第一Slave节点,其特征在于,所述第一分布式集群还包括第一参考节点与第一备用节点,其中,所述第一Master节点用于监控所述第一分布式集群中的其它节点,所述第一备用节点用于在所述第一Master节点发生故障时替换所述第一Master节点,所述第一备用节点还用于监控所述第一Master节点、所述第一参考节点与所述第一Slave节点,所述第一参考节点用于监控所述第一Master节点和所述第一备用节点,所述第一Slave节点用于执行所述第一Master节点下发的指令,所述方法包括:所述第一备用节点接收所述第一参考节点发送的心跳消息,所述心跳消息包括用于指示所述第一参考节点与所述第一Master节点处于失联状态的第一指示信息;所述第一备用节点根据所述第一指示信息,确定所述第一参考节点与所述第一Master节点处于失联状态;所述第一备用节点检测所述第一Master节点向所述第一备用节点发送的心跳消息是否中断;在检测到所述第一Master节点向所述第一备用节点发送的心跳消息中断的情况下,所述第一备用节点确定所述第一备用节点与所述第一Master节点也处于失联状态;所述第一备用节点确定与所述第一备用节点和所述第一参考节点均失联的所述第一Master节点发生故障。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510068053.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种实现电路拓扑调度的方法及装置
- 下一篇:一种业务劣化监测方法和装置