[发明专利]一种云计算服务器的故障恢复方法、装置及管理系统在审
申请号: | 201710160761.7 | 申请日: | 2017-03-17 |
公开(公告)号: | CN108632057A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 欧亚聪 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 云计算服务器 故障恢复 操作系统故障 故障处理策略 故障信息 管理系统 遗留系统 应用故障 硬件资源 云计算平台 高可靠性 管理平台 平稳运行 信息确定 发送 保证 | ||
本发明实施例公开了一种云计算服务器的故障恢复方法、装置和管理系统,该方法包括:获取IaaS管理平台所发送的硬件资源故障信息,获取云计算服务器的操作系统故障信息,获取云计算服务器的应用故障信息;根据所获取到的硬件资源故障信息、操作系统故障信息和应用故障信息确定所述云计算服务器的故障根因;根据故障根因确定故障处理策略;根据故障处理策略所指示的操作进行故障恢复。实施本发明实施例,可以在云计算平台为企业的遗留系统提供高可靠性保障,有利于保证遗留系统的可靠平稳运行。
技术领域
本发明涉及云计算技术领域,尤其涉及一种云计算服务器的故障恢复方法、装置及管理系统。
背景技术
云计算(Cloud Computing)是一种新兴的商业计算模型,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算能力、存储空间和各种软件服务。为了获取云计算带来的一系列好处的,包括降低运维的复杂度,节约硬件成本等,越来越多的企业选择将传统的IT系统放迁移到云计算相关的资源池上面运行,让整个IT系统可以利用云计算的服务来来实现统一的运维,这些IT系统的运行环境随之发生了巨大的变化,由于云计算平台的可靠性并没有专用的服务器高,所以在云计算平台中必须充分考虑当部分计算资源失效时如何继续保证系统的可靠运行。在云计算平台下,计算资源是按需从资源池中分配的,当计算资源失效时,需要等待云重新调度分配计算资源,例如通过弹性伸缩来触发等。在现有技术中,为了适应云计算的架构,如果要保证传统的IT系统迁移到云计算相关的资源池之后,也能获得高可靠性(High Availability,HA)的保障,通常要求该IT系统是云就绪(Cloud-Ready)类型的系统。对于Cloud-Ready类型的系统,首先,它应该是一个分布式的系统,具有高度的内聚性和透明性;其次,它应该是冗余的,能处理服务器失效的情况,不存在单点故障。
然而,企业内部的IT系统中往往也存在部分不具有上述特点的遗留系统,这些遗留系统采取烟囱式垂直系统构建,在架构层面没有充分考虑云环境中资源动态分配,资源失效等情况,属于非“Cloud-Ready”类型的系统。从架构兼容的角度来看,垂直系统和分布式系统并不具备耦合性,而目前云计算一般针对于分布式系统而设计,所以目前云计算平台通用的HA方案不能适用于企业遗留系统,当企业将整个IT系统(包括这些遗留系统),全部都迁移到云计算相关的资源池上后,对于其中的遗留系统而言,只是简单将系统重新部署到云分配的计算资源上,并不能获得云计算对其可靠性的保障,例如无法实现弹性伸缩,按需分配资源等,因此在可靠性方面将面临很大的挑战。
发明内容
本发明实施例提供一种云计算服务器的故障恢复方法、装置及管理系统,以解决遗留系统迁移到云上后的可靠性问题。
第一方面,本发明实施例提供了云计算服务器的故障恢复方法,应用于云计算服务器,包括:
PaaS管理平台获取基础设施即服务IaaS管理平台所发送的硬件资源故障信息,其中,所述IaaS管理平台用于管理所述云计算服务器的硬件资源,还用于检测所述硬件资源的硬件资源故障信息,所述IaaS管理平台独立于所述云计算服务器;获取所述云计算服务器的操作系统故障信息,所述操作系统故障信息用于指示安装于所述云计算服务器的操作系统所出现的故障;获取所述云计算服务器的应用故障信息,所述应用故障信息用于指示安装于所述操作系统的应用所出现的故障;
根据所获取到的所述硬件资源故障信息、所述操作系统故障信息和所述应用故障信息确定所述云计算服务器的故障根因;根据所述故障根因确定故障处理策略;根据所述故障处理策略所指示的操作进行故障恢复。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710160761.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络控制的方法和装置以及通信系统
- 下一篇:网络切片的管理方法和装置