[发明专利]分布式资源状态快速跟踪方法及系统在审
申请号: | 201911355982.5 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111082994A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 尹微;胡晓鹏;周泽湘;罗华;仇悦;文中领 | 申请(专利权)人: | 北京同有飞骥科技股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京方韬法业专利代理事务所(普通合伙) 11303 | 代理人: | 党小林 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 资源 状态 快速 跟踪 方法 系统 | ||
本发明提供了一种分布式资源状态快速跟踪方法及系统。所述方法包括:获取分布式集群上传的,包含多级故障域信息的故障编码信息;根据故障编码信息,对相同层级的故障编码信息进行归并;以及基于归并后的故障编码信息,跟踪故障状态。本发明提供的分布式资源状态快速跟踪方法及系统引入多级故障域的定义机制,对同一故障域的资源不工作状态的快速判定,用于加快分布式集群的状态快速跟踪,可以优化服务级别。
技术领域
本发明涉及分布式系统技术领域,特别是涉及一种分布式资源状态快速跟踪方法及系统。
背景技术
随着分布式集群越来越大,资源越来越多,当资源发生故障时,集群未能及时发现,对故障资源不能及时有效的处理,直接影响到集群的性能。
现有的资源故障方案当资源发生故障时,比如磁盘故障,心跳丢失,单个逐一上报,心跳丢失到达一定次数后,才判定资源故障。
当有某种逻辑关系的物理资源批量掉线时,单个逐一上报耗时久,不能快速处理。比如某一台设备故障,该设备下所有物理磁盘都掉线,不能走批量处理,响应不及时。
发明内容
本发明要解决的技术问题是提供一种分布式资源状态快速跟踪方法及系统,引入多级故障域的定义机制,对同一故障域的资源不工作状态的快速判定,用于加快分布式集群的状态快速跟踪,可以优化服务级别。
为解决上述技术问题,本发明提供了一种分布式资源状态快速跟踪方法,所述方法包括:获取分布式集群上传的,包含多级故障域信息的故障编码信息;根据故障编码信息,对相同层级的故障编码信息进行归并;以及基于归并后的故障编码信息,跟踪故障状态。
在一些实施方式中,故障编码信息中包含的多级故障域信息包括:数据中心级的故障域信息、排序号级的故障域信息、机架序号级的故障域信息、节点序号级的故障域信息,以及磁盘序号级的故障域信息。
在一些实施方式中,基于归并后的故障编码信息,对相同层级的故障编码信息进行归并,包括:如果同一个故障域内的多个下属节点均上传故障编码信息,对该故障域内所有下属节点进行归并。
在一些实施方式中,基于归并后的故障编码信息,跟踪故障状态,包括:向故障域内所有下述节点均发送用来跟踪故障状态的心跳包。
在一些实施方式中,基于归并后的故障编码信息,对相同层级的故障编码信息进行归并,包括:如果上层节点上传故障编码信息,对该上层节点的所有下属节点进行归并。
在一些实施方式中,基于归并后的故障编码信息,跟踪故障状态,包括:向上层节点的所有下属节点均发送用来跟踪故障状态的心跳包。
此外,本发明还提供了一种分布式资源状态快速跟踪系统,所述系统包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据前文所述的分布式资源状态快速跟踪方法。
采用这样的设计后,本发明至少具有以下优点:
1.集群对资源不工作的判定加快。从两个方便来加快,第一个根据多级的域来判定,域故障整个下属的都故障。第二个同一域多个故障合并,减少了上报的通信次数;
2.资源不工作的判定加快,也就优化了集群的重要指标资源故障恢复时间(资源故障恢复时间为资源故障后集群识别的时间加上集群恢复的时间)。
附图说明
上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
图1是本发明实施例提供的分布式资源状态快速跟踪方法的流程图;
图2是本发明实施例提供的分布式资源状态快速跟踪系统的结构图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京同有飞骥科技股份有限公司,未经北京同有飞骥科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911355982.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车用离合器
- 下一篇:一种基于外界风况的风力发电机组主动降载控制方法