[发明专利]一种云平台大规模主机故障的处理方法有效
| 申请号: | 202010728174.5 | 申请日: | 2020-07-29 |
| 公开(公告)号: | CN111970147B | 公开(公告)日: | 2022-05-06 |
| 发明(设计)人: | 苏正伟 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | H04L41/0654 | 分类号: | H04L41/0654;H04L67/10;G06F11/07;G06F9/50;G06F9/48 |
| 代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 朱晓熹 |
| 地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 平台 大规模 主机 故障 处理 方法 | ||
本发明公开一种云平台大规模主机故障的处理方法,包括划分主机组,主机组配置对应的故障主机队列;设定主机中的云主机初始优先级值,设定云主机疏散次数阈值;检测故障主机,故障主机按照优先级排列于故障主机队列中,故障主机中的云主机按照优先级值排列;主机组按故障主机排序处理对应故障主机队列中的故障主机,按照云主机排序处理云主机;云主机疏散失败根据优先级值变化规则,确定优先级值;检测故障主机队列所对应的主机组的疏散能力,关闭疏散能力弱的故障主机队列;将被关闭的故障主机队列中的故障主机按优先级排列于剩余队列;开启符合条件的故障主机队列。本发明能够有效分配集群资源,高效有序的疏散故障主机中的云主机。
技术领域
本发明涉及云平台主机故障处理方法领域,尤其涉及一种云平台大规模主机故障的处理方法。
背景技术
云平台是指基于硬件资源和软件资源提供计算、网络和存储的服务平台。一般部署于大规模集群环境。当某主机节点发生故障不能继续提供服务后,运行其上云主机可以通过高可用功能疏散到其他物理主机上,保证虚拟机能够正常使用,用户业务不会受到影响。
目前,各厂商在疏散云主机的流程上基本相似包括监控检测故障主机节点;隔离故障计算节点,以避免故障节点接收新的数据;将故障主机节点上的虚拟机疏散到其他主机节点上。机械地将云主机从故障主机节点疏散到其他健康主机节点上,未对恢复过程进行有效控制。这样能够很好的处理云计算平台单节点主机故障,但是对于大规模的主机故障却力不从心。如主机A上有云主机a1、a2~am,主机B上有云主机b1、b2~bn。当主机A发生故障时,假设主机A上所有云主机疏散到主机B上,如果此时主机B也发生故障,则主机A上的所有云主机有可能发生错乱疏散,并且在节点故障排除后无法自行恢复。当大规模主机发生故障后,如果机械地都去进行故障恢复而不加以限制,有可能造成大规模云主机的错乱疏散,导致整个云平台的崩溃。
另外,主机节点上云主机根据承载的业务不同,有的用户价值高,有的就可能没那么重要。当主机集群发生大规模故障时,因为计算资源急剧收缩,可能存在资源不足的情况,所以无法保证全部的故障主机及云主机得到恢复。此时,保障高价值的用户业务优先恢复也是计算高可用的现实需求之一。
发明内容
本发明提供云平台大规模主机故障的处理方法,旨在解决现有技术当大规模主机发生故障后,如果机械地都去进行故障恢复而不加以限制,有可能造成大规模云主机的错乱疏散,导致整个云平台的崩溃的问题。
为实现上述目的,本发明提供一种云平台大规模主机故障的处理方法,包括,
S100,对集群中的主机划分主机组,主机组配置对应的故障主机队列;
S200,设定主机中的云主机初始优先级值,设定云主机疏散次数阈值;
S300,检测故障主机,故障主机按照优先级排列于故障主机队列中,故障主机中的云主机按照优先级值排列;
S400,主机组按故障主机排序处理对应故障主机队列中的故障主机,按照云主机排序处理云主机;云主机疏散失败根据优先级值变化规则,确定优先级值;
S500,检测故障主机队列所对应的主机组的疏散能力,关闭疏散能力弱的故障主机队列;
S600,将被关闭的故障主机队列中的故障主机按优先级排列于剩余队列;
S700,开启符合条件的故障主机队列。
优选地,检测故障主机队列对应的主机组疏散能力,包括统计故障主机队列对应的主机组疏散失败的云主机数量,一段时间内失败云主机数量与预设的阈值比较,超过则关闭所述故障主机队列。
优选地,设定主机中的云主机初始优先级值,设定云主机疏散次数阈值包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010728174.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PVC压延膜生产工艺
- 下一篇:泵体组件、压缩机和空调器





