[发明专利]用于虚拟计算环境中的故障管理的方法和系统有效
申请号: | 201080048606.2 | 申请日: | 2010-08-31 |
公开(公告)号: | CN102597962A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | D·R·弗兰克林 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 付建军 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 虚拟 计算 环境 中的 故障 管理 方法 系统 | ||
技术领域
本发明涉及故障管理的领域。特别地,本发明涉及虚拟计算环境中的故障管理。
背景技术
通常在虚拟环境中运行操作系统。这些操作系统进而被用于运行实现各种服务的应用。每个虚拟机(VM)直接复制一台物理计算机,但在物理主机上的管理程序(hypervisor)之下运行。一个主机能够容纳多个VM。为了最大化主机利用率以及提高故障容许度,VM通常在一群(cluster)主机上运行。如果一个主机发生故障,则VM能够移动(或者迁移)为在该群中的另一个主机上运行。
在VM上发生故障的方式与在物理机器上发生故障的方式类似。故障管理系统能够被用于检测和监视这些问题并且将它们报告给操作员,以实现快速解决。例如,是服务级管理系统,用于从包括故障事件的许多不同的网络数据源收集企业范围的事件信息(IBM、Tivoli和Netcool是IBM公司在全球许多司法管辖范围内注册的商标)。
在虚拟环境中,故障可能由运行VM的主管理程序系统上的故障引起。如果许多VM正由单个主机运行,则这能够潜在导致报告不是由VM本身的故障导致的大批故障。对于操作员快速完成工作和修补,这可能令人迷惑并且耗时。另外,即使管理程序故障监视也被实现,这种(常常不太严重)的根由(root cause)故障会在大批VM故障事件中被错过并且被操作员忽视。
此外,解决VM上的某些故障的一种方法是将它们移至不同的物理主机。这将导致即时解决某些问题,但是在这些VM上运行的传统故障监视系统更新这种状态变化以及清除问题较慢。
因此,需要解决现有技术中的上述问题。
发明内容
根据本发明的第一方面,提供了一种用于虚拟计算环境中的故障管理的方法,包括:在虚拟计算环境中监视虚拟机和主机装置的故障事件;在虚拟计算环境中监视状况事件,其中状况事件是指虚拟机名称和主机装置名称;确定故障事件是否影响虚拟机和主机装置二者;将涉及相同问题的关于虚拟机和主机装置的故障事件进行相关。
该方法可以包括:保持虚拟机状态表;以及保持虚拟机名称和主机装置名称的映射。
该方法还可以包括将故障事件插入到故障事件表中。与问题相关的主机故障事件可以在故障事件表中被标记为根事件。与问题相关的虚拟机故障事件可以在故障事件表中被标记为症状,并且至根事件的链接被加入故障事件表中。
当虚拟机移至新主机时,该虚拟机的所有故障事件可以处于故障事件表中并且严重性被降低。此外,根链接可以被移除。
状况事件可以由监视系统(探测器(probe)从其得到事件警报)进行监视并且包括虚拟机和主机装置与主机故障事件之间的关系的指示。
可以通过在虚拟机上运行的探测器提供虚拟机中的故障事件并且可以通过在主机上运行的探测器提供主机中的故障事件。
可以由监视系统(探测器从其得到事件警报)监视主机中的故障事件。
根据本发明的第二方面,提供了一种用于虚拟计算环境中的故障管理的计算机软件产品,该产品包括计算机可读存储介质,存储其中存储有包括计算机可执行指令的程序的计算机,这些指令当由计算机读取执行时执行下面的步骤:在虚拟计算环境中监视虚拟机和主机装置的故障事件;在虚拟计算环境中监视状况事件,其中状况事件是指虚拟机名称和主机装置名称;确定故障事件是否影响虚拟机和主机装置二者;将涉及相同问题的关于虚拟机和主机装置的故障事件进行相关。
根据本发明的第三方面,提供了一种用于虚拟计算环境中的故障管理的系统,包括:处理器;在虚拟计算环境中虚拟机和主机装置的故障事件的监视器;在虚拟计算环境中状况事件的监视器,其中状况事件是指虚拟机名称和主机装置名称;规格化组件,用于确定故障事件是否影响虚拟机和主机装置二者;以及相关组件,用于将涉及相同问题的关于虚拟机和主机装置的故障事件进行相关。
该系统可以包括虚拟机状态表以及虚拟机名称与主机装置名称的映射。
该系统还可以包括故障事件表,用于保持关于虚拟机或者主机装置的故障事件的列表。该系统可以包括针对与问题相关的主机故障事件的故障事件表中的根事件标记。该系统还可以包括针对与问题相关的虚拟机故障事件的故障事件表中的症状标记以及至故障事件表中的根事件的链接。
该系统可以包括故障解决组件,其中当虚拟机移至新主机时,解决组件将该虚拟机的所有故障事件安置在故障事件表中并且降低事件的严重性。
用于状况事件的监视器可以从虚拟环境群控制中心获得状况事件并且可以将事件警报提供给故障管理系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080048606.2/2.html,转载请声明来源钻瓜专利网。