[发明专利]存储系统监控及故障收集方法、装置、终端及存储介质在审
申请号: | 202210589713.0 | 申请日: | 2022-05-27 |
公开(公告)号: | CN114911578A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 王福军 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/455 | 分类号: | G06F9/455 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 赵阳 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储系统 监控 故障 收集 方法 装置 终端 存储 介质 | ||
本发明涉及存储系统监控领域,具体公开一种存储系统监控及故障收集方法、装置、终端及存储介质,搭建监控服务器,使监控服务器与存储系统通信;登录存储系统,周期性访问存储系统,查询存储系统状态;当存储系统状态异常时,触发dump文件收集;根据收集的dump文件中数据进行存储系统故障原因分析及故障原因定位。本发明搭建监控服务器,在故障时及时收集dump信息或者OSES信息,所收集信息中包含故障信息,从而进行故障信息分析和定位,避免故障问题无法复现或复现困难的窘境。
技术领域
本发明涉及存储系统监控领域,具体涉及一种存储系统监控及故障收集方法、装置、终端及存储介质。
背景技术
在测试过程中,测试人员无法一直盯着存储系统运行,或者有些需要长时间进行的故障注入或反复测试,需要通过脚本进行这些调度,所以不能频繁的去查看存储系统状态,而存储系统的日志会随着时间增长,可能日志会被覆盖,当发现异常的时候无法查看问题发生时的日志。有些故障的发生具有概率性,不能每次都可以复现,所以有些故障一旦错过了当时的信息,再次复现需要花费大量的人力成本和时间成本。
发明内容
为解决上述问题,本发明提供一种存储系统监控及故障收集方法、装置、终端及存储介质,实现在故障发生后,收集所需要的所有信息,进行故障分析及定位。
第一方面,本发明的技术方案提供一种存储系统监控及故障收集方法,包括以下步骤:
搭建监控服务器,使监控服务器与存储系统通信;
登录存储系统,周期性访问存储系统,查询存储系统状态;
当存储系统状态异常时,触发dump文件收集;
根据收集的dump文件中数据进行存储系统故障原因分析及故障原因定位。
进一步地,监控服务器通过串口连接到存储系统的每个控制器;
该方法还包括以下步骤:
若无法登录存储系统,则每间隔预设时间进行一次登录尝试;
若尝试登录预设次数后,仍无法登录存储系统,则进入每个控制器的机箱管理服务;
在机箱管理服务下,通过指令查询指定信息进行记录;
根据记录的指定信息进行存储系统故障原因分析及故障原因定位。
进一步地,正常登陆存储系统时,访问存储系统的周期与存储系统的故障注入周期相同。
进一步地,查询的存储系统状态包括集群状态、告警事件;
存储系统状态异常包括集群状态与预期不符或者产生了非预期的告警事件。
第二方面,本发明的技术方案提供一种存储系统监控及故障收集装置,其特征在于,搭建监控服务器,使监控服务器与存储系统通信;
该装置包括,
登录模块:登录存储系统;
状态查询模块:周期性访问存储系统,查询存储系统状态;
文件收集触发模块:当存储系统状态异常时,触发dump文件收集;
第一故障分析定位模块:根据收集的dump文件中数据进行存储系统故障原因分析及故障原因定位。
进一步地,监控服务器通过串口连接到存储系统的每个控制器;
登录模块若无法登录存储系统,则每间隔预设时间进行一次登录尝试;
该装置还包括,
机箱管理服务进入模块:若尝试登录预设次数后,仍无法登录存储系统,则进入每个控制器的机箱管理服务;
指定信息查询记录模块:在机箱管理服务下,通过指令查询指定信息进行记录;
第二故障分析定位模块:根据记录的指定信息进行存储系统故障原因分析及故障原因定位。
进一步地,状态查询模块访问存储系统的周期与存储系统的故障注入周期相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210589713.0/2.html,转载请声明来源钻瓜专利网。