[发明专利]一种高性能集群故障的诊断方法及系统在审
申请号: | 201810825121.8 | 申请日: | 2018-07-24 |
公开(公告)号: | CN109167676A | 公开(公告)日: | 2019-01-08 |
发明(设计)人: | 宋辰 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 李修杰 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集群 基本信息 可视化显示 诊断 格式转化模块 故障处理模块 故障排查效率 信息收集模块 格式转换 故障处理 故障定位 故障排查 加载命令 快速定位 显示模块 诊断系统 故障点 主节点 脚本 加载 申请 转化 直观 | ||
本申请公开了一种高性能集群故障的诊断方法及系统,该诊断方法包括:在高性能集群的主节点中收集高性能集群中各节点的基本信息;对基本信息进行格式转换,并转化为HTML文档形式的基本信息;根据所获取的加载命令,将HTML文档形式的基本信息加载到本地,并以web界面的形式进行可视化显示;根据web界面中所显示的内容,进行故障定位和故障处理。该诊断系统包括:信息收集模块、格式转化模块、显示模块和故障处理模块。本申请采用脚本对高性能集群中各节点的基本信息进行收集、转化并进行可视化显示,使用户能够非常直观地查看高性能集群的状态,从而有利于故障点的快速定位,能够有效提高故障排查的准确性和故障排查效率。
技术领域
本申请涉及服务器高性能计算技术领域,特别是涉及一种高性能集群故障的诊断方法及系统。
背景技术
高性能计算已成为继理论科学和实验科学之后,科学探索的第三范式,被广泛应用于多个工业及行业领域,其中,随着高性能计算技术的发展,用户自行搭建的中小规模高性能集群的应用范围越来越广。对这些中小规模的高性能集群进行运维管理,及时排查故障并完成日常维护,是个重要问题。对中小规模的高性能集群进行运维管理的核心,就是对高性能集群的信息进行收集。收集到高性能集群的信息后,针对所收集到的集群信息进行分析,根据分析结果对高性能集群进行维护。
目前,对中小规模高性能集群进行信息收集的方法,主要是:当集群发生故障时,需要分别登录各个节点,在各个节点上手动查看并分析各类日志文件和相关信息,然后根据各类相关信息,逐步排除故障。
然而,目前对中小规模高性能集群进行信息收集的方法中,由于高性能集群本身的复杂性,导致高性能集群日志多种多样,且文件数量较多,目前采用手动处理各类集群信息,使得故障排查工作量较大,导致故障排查效率较低,而且由于采用人工手动处理各类集群信息,容易产生误差,从而导致故障排查准确性较低。
发明内容
本申请提供了一种高性能集群故障的诊断方法及系统,以解决现有技术中高性能集群故障排查效率低和故障排查准确性较低的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种高性能集群故障的诊断方法,所述诊断方法包括:
在高性能集群的主节点中收集高性能集群中各节点的基本信息,所述基本信息包括:节点的硬件信息、节点的系统日志、节点的操作系统信息、节点网络信息、主节点的服务器状态信息、计算节点的服务状态信息、Lustre文件系统状态以及集群管理平台的状态信息;
对所述基本信息进行格式转换,并转化为HTML文档形式的基本信息;
根据所获取的加载命令,将所述HTML文档形式的基本信息加载到本地,并以web界面的形式进行可视化显示;
根据web界面中所显示的内容,进行故障定位和故障处理。
可选地,对所述基本信息进行格式转换,并转化为HTML文档形式的基本信息之后,所述诊断方法还包括:
利用CSS(Cascading Style Sheet,层叠样式表单)格式定义文件,对所述HTML文档形式的基本信息进行层叠样式定义,形成CSS格式的基本信息。
可选地,所述根据所获取的加载命令,将所述HTML文档形式的基本信息加载到本地,并以web界面的形式进行可视化显示,具体为:
根据所获取的加载命令,将所述CSS格式的基本信息加载到本地,并以web界面的形式进行可视化显示。
可选地,所述在高性能集群的主节点中收集高性能集群中各节点的基本信息之前,所述诊断方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810825121.8/2.html,转载请声明来源钻瓜专利网。