[发明专利]共同操作的多映像系统中的第二故障数据捕获有效
申请号: | 201310343980.0 | 申请日: | 2013-08-08 |
公开(公告)号: | CN103577273A | 公开(公告)日: | 2014-02-12 |
发明(设计)人: | R.N.张伯伦;A.J.皮尔金顿;H.J.赫利尔;M.F.彼得斯 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/34 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 周少杰 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 共同 操作 映像 系统 中的 第二 故障 数据 捕获 | ||
技术领域
本发明涉及计算机系统中的诊断数据的自动捕获,特别是共同操作的多映像计算机系统中的诊断数据的自动捕获。
背景技术
诊断数据的自动捕获在计算机系统中是众所周知的。具体地,它通常用在复杂的和/或长时间运行应用中以允许问题的快速解决,而不需要现场再现故障或备份系统。已知的解决方案是以转储、日志和跟踪文件的形式提供第一故障数据捕获(FFDC),数据捕获在检测到问题时触发。
该已知的解决方案的问题是在获得用于分析和解决问题的足够诊断信息的需求和产生该诊断信息的成本之间存在折中。产生诊断信息的成本可以包括a)用于连续日志记录和跟踪的应用的性能开销,b)对故障产生转储所花的时间(这可能延迟应用的重启),以及c)存储诊断信息输出要求的磁盘空间量。
WO2012/026035A公开了一种故障处理系统,其具有:存储位置信息获取单元,用于从其中已经出现故障的组件的存储单元中获取表示在故障发生时生成的故障信息的存储位置的存储位置信息;故障信息获取单元,用于基于存储位置信息,从存储设备获取在故障发生时在信息处理设备中生成的、与故障有关的故障信息,该存储设备被连接以便能够与信息处理设备和故障处理设备通信;以及配置控制单元,用于基于获取的故障信息,根据信息处理设备修改故障处理设备的配置。从而,故障处理系统能够容易地再现在信息处理设备中出现的故障,以便有效地执行再现试验。
因此,现有技术中存在处理上述问题的需要。
发明内容
本发明的实施例提供一种用于捕获诊断跟踪信息的方法,所述方法用于具有多个软件映像的计算机系统中,所述方法包括以下步骤:接收与所述多个软件映像的第一个中的第一故障有关的信息;将所述信息分发到所述多个软件映像的其它软件映像;捕获与所述多个软件映像中的另一个中的第二故障有关的信息。该方法的优点是,捕获跟踪诊断信息的成本被最小化,直到第一故障出现,此后,捕获的跟踪诊断信息的值被最大化,并且通过只捕获与第一故障有关的详细跟踪诊断信息,捕获跟踪诊断信息的成本被最小化。
在实施例中,所述分发所述信息的步骤由负荷平衡器、管理程序、操作系统、监视软件或对等通信机构中的一个执行。
在优选实施例中,所述将所述信息分发到所述多个软件映像的其他软件映像的步骤包括:将所述信息的第一部分分发到所述多个软件映像中的第一多个软件映像,并且将所述信息的第二部分分发到所述多个软件映像中的第二多个软件映像。这具有的优点是,分发了跨越软件映像收集诊断跟踪信息的负荷,并且仍然允许全面的跟踪诊断信息的收集。
在优选实施例中,所述捕获信息的步骤在预定时间段之后过期。在可替代实施例中,所述捕获信息的步骤在第二故障之后过期。这些实施例具有的优点是,限制在其期间捕获另外的诊断跟踪信息的时间段,并且因此限制捕获诊断跟踪信息的另外成本。
在另一实施例中,所述软件映像的每个还包括进程或线程;以及所述接收的信息与所述进程或线程的第一进程或线程中的第一故障有关;所述分发的信息分发到所述进程或线程的其他进程或线程;所述捕获的信息与所述进程或线程的另一个中的第二故障有关。
在另一实施例中,所述接收的诊断跟踪信息识别所述软件映像的外部因素作为所述第一故障的原因。这具有的优点是,由于外部因素(如网络故障)导致的故障可能导致要在每个软件映像中收集的与外部因素有关的另外的跟踪诊断信息。
在另一实施例中,所述方法还包括以下步骤:在所述接收步骤之后,检查所述多个软件映像的一个或多个其他软件映像是否正在执行与所述多个软件映像中的所述第一软件映像相同的软件。
在另一实施例中,所述方法还包括以下步骤:将所述与所述多个软件映像的第一软件映像中的第一故障有关的信息和所述与所述多个软件映像的另一个中的第二故障有关的信息组合;分析所述组合的信息以便确定第一故障的原因。跟踪诊断信息的这种组合和分析允许确定故障的原因,而不需要现场再现故障或备份系统。
在另一实施例中,所述捕获信息的步骤持续,直到所述分析所述组合的信息以便确定第一故障的原因的步骤结束。这允许捕获来自任何进一步故障的信息,同时组合和分析来自之前故障的跟踪诊断信息,而是允许在分析结束时停止捕获。
本发明的实施例还提供了一种计算机系统和用于实现捕获诊断跟踪信息的上述方法的计算机程序产品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310343980.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种保险丝加热器延时装置
- 下一篇:一种用于制镜线抛光粉桶的搅拌机构