[发明专利]服务器集群系统故障定位方法无效
申请号: | 201110460059.5 | 申请日: | 2011-12-31 |
公开(公告)号: | CN102420710A | 公开(公告)日: | 2012-04-18 |
发明(设计)人: | 张考华 | 申请(专利权)人: | 曙光信息产业股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京德恒律师事务所 11306 | 代理人: | 陆鑫;房岭梅 |
地址: | 300384 天津市西青区华*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 集群 系统故障 定位 方法 | ||
技术领域
本发明基本上设计服务器领域,更具体地来说,设计一种服务器集群系统故障定位方法。
背景技术
服务器作为集成网络系统中一个非常重要的核心设备,其使用环境离不开网络环境。现在的服务器集群网络,往往由少则数十,多则数千台的服务器组成。在实际部署时,其操作系统不可能是一台一台去手工安装,而是依赖于稳定可靠的网络环境,由机房管理软件进行集中自动安装。这样在操作系统安装之前,一旦出现网络故障,我们会发现可以使用的定位分析手段相对就非常匮乏。
对于这些在机房进行实际的服务器集群部署时,我们经常会遇到这样那样的网络问题。目前对这些网络问题的定位,基本是在操作系统的应用环境下,利用相应的诊断调试工具进行的。由于这些诊断调试工具都是依赖于操作系统的,对于不同的操作系统,虽然网络协议是标准的,但诊断调试工具本身对报文的处理,解析都存在一定的差异。再加上操作系统环境下其他相关软件的影响,经常会对问题的定位分析造成干扰。
现有技术提供了一种远程控制并诊断服务器电源故障的方法,是通过远程管理中心的程序界面控制服务器电源模块的开关,查看服务器电源的工作状态、风扇转速、温度、电流、功率数据信息,有效地诊断电源有无损坏。该现有技术在一定程度上提高了效率。
然而,上述现有技术只能用于诊断服务器内部的问题,则无法应用于诊断服务器集群系统中的服务器之间的通信故障,况且现有的诊断方法都要运行于操作系统下,而在没有安装操作系统时便无法进行诊断。
发明内容
根据上述现有技术的缺陷,本发明提供了一种服务器集群系统故障定位方法,通过该方法,解决了如何对集群服务器系统中的服务器的故障进行定位的技术问题,特别是解决了如何在没有安装操作系统的情况下对于服务器进行诊断的技术问题。
根据本发明的一个方面,提供了一种服务器集群系统故障定位方法,所述服务器集群系统包括第一服务器、传输通路和第二服务器,所述第一服务器和所述第二服务器均运行在UEFI环境下,所述第一服务器通过所述传输通路向所述第二服务器发送的信号与所述第二服务器接收到的信号不同,其特征在于,所述方法包括:步骤S1:所述第一服务器通过以太网网卡向所述第二服务器发送第一信号,所述第二服务器通过以太网网卡的对外环回功能,把所述第一信号反向发送回所述第一服务器;步骤S2:所述第一服务器接收到第二信号;以及步骤S3:通过比较所述第一信号和所述第二信号确定所述服务器集群系统的故障位置。
在该服务器集群系统故障定位方法中,所述步骤S3包括:如果所述第一信号与所述第二信号相同,则故障发生在所述第二服务器。
在该服务器集群系统故障定位方法中,所述步骤S3包括:如果所述第一信号与所述第二信号不同,则故障发生在所述第一服务器或者所述传输通路。
在该服务器集群系统故障定位方法中,所述第一服务器或者所述第二服务器中未安装操作系统和应用软件。
在该服务器集群系统故障定位方法中,所述步骤S1包括:步骤S11:向所述管理模块输入第一信号或者所述管理模块采集与其相连接的功能模块的信息作为第一信号;以及步骤S12:所述第一服务器在UEFI环境下通过以太网网卡将所述第一信号发送到所述第二服务器,所述第二服务器通过以太网网卡的对外环回功能,把所述第一信号反向发送回所述第一服务器。
在该服务器集群系统故障定位方法中,所述步骤S1进一步包括以下步骤中的至少一个:通过所述管理模块查询帮助信息;通过所述管理模块生成第一报文,并将所述第一报文发送到所述第一服务器;通过所述管理模块生成第二报文,并将所述第二报文发送到所述第二服务器;通过所述管理模块配置所述第一服务器的参数;以及通过所述管理模块配置所述第二服务器的参数。
在该服务器集群系统故障定位方法中,所述管理模块为计算机,
在该服务器集群系统故障定位方法中,所述功能模块为所述第一服务器。
在该服务器集群系统故障定位方法中,所述传输通路为以太网。
通过上述服务器集群系统故障定位方法,可以排除网络诊断对操作系统环境的依赖,同时可以排除集群中不同服务器节点因为操作系统差异,及操作系统上面运行各种应用程序,对故障定位的干扰,使得定位准确,高效。同时在不依赖操作系统的环境下提前把集群网络的联通性调试好,可以为后续对整个集群各个节点进行远程操作系统部署安装提供条件,从而大大提高整个集群的部署速度。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业股份有限公司,未经曙光信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110460059.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车动力电池的模拟方法和装置
- 下一篇:电动机保护器电源模块