[发明专利]一种存储集群的故障检测方法、装置、设备及存储介质有效
申请号: | 201810796601.6 | 申请日: | 2018-07-19 |
公开(公告)号: | CN109086185B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 李娟;李强;袁鹏飞 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/32 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存储 集群 故障 检测 方法 装置 设备 介质 | ||
本申请公开了一种存储集群的故障检测方法,在目标存储集群中存在信息传输时,通过获取各运行节点对应的运行数据;并利用各运行数据并依据预设的逻辑整理出工作流;其中,运行节点包括存储节点、中间件和管理软件;然后根据工作流分析目标存储集群的故障情况,可见本发明通过将各运行数据按照预设的逻辑整理出工作流,通过查看工作流的情况分析目标存储集群的故障情况,不仅增加了检测的节点类型,而且能够通过工作流对各节点之间的关联进行检测,使得检测结果更加全面。本申请还公开了一种存储集群的故障检测装置、设备及计算机可读存储介质,均具有上述有益效果。
技术领域
本发明涉及故障检测领域,特别涉及一种存储集群的故障检测方法、装置、设备及计算机可读存储介质。
背景技术
随着信息技术的不断发展,存储集群中的节点如存储节点和管理软件的数量逐渐增多,存储集群的组成情况也越来越复杂。为了提高存储集群运行过程的可靠性,需要对存储集群进行故障检测。
现有技术对存储集群的故障检测方法主要是通过在各个存储节点上设置监控软件,通过根据各监控软件获取到的各对应的存储节点的运行状况判断存储节点是否存在故障。但是在实际的存储集群环境中,不只是存储节点会出现故障,其他的节点如中间件、管理系统等也会出现故障导致信息传输受阻,并且信息在各节点之间的传输过程会受到节点之间关联的影响,因此现有技术中只对存储节点进行检测故障的方式使得检测结果比较片面。
因此,如何提供一种能够对存储集群进行更全面的故障检测的方法是本领域技术人员目前需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种存储集群的故障检测方法,能够对存储集群进行更全面的故障检测;本发明的另一目的是提供一种存储集群的故障检测装置、设备及计算机可读存储介质,均具有上述有益效果。
为解决上述技术问题,本发明提供一种存储集群的故障检测方法,包括:
在目标存储集群中存在信息传输时,获取各运行节点对应的运行数据;其中,所述运行节点包括存储节点、中间件和管理系统;
利用各所述运行数据并依据预设的逻辑整理出工作流;
根据所述工作流分析所述目标存储集群的故障情况。
优选地,所述获取各运行节点对应的运行数据具体为:
通过在各所述运行节点上分别部署代理器agent以获取对应的运行数据。
优选地,所述通过在各所述运行节点上分别部署代理器agent以获取对应的运行数据具体为:
各所述代理器agent按照预设的时间周期获取各所述运行节点对应的运行数据。
优选地,所述运行数据具体包括所述信息的发送方信息和接收方信息;
对应的,所述利用各所述运行数据并依据预设的逻辑整理出工作流具体为:
利用所述发送方信息和所述接收方信息并依据节点序列整理出工作流。
优选地,所述运行数据具体包括所述信息的接收时间和发送时间;
对应的,所述利用各所述运行数据并依据预设的逻辑整理出工作流具体为:
利用所述接收时间和所述发送时间并依据时间序列整理出工作流。
优选地,在所述根据所述工作流分析所述目标集群的故障情况之后进一步包括:
将所述工作流进行存储。
优选地,在所述将所述工作流进行存储之后进一步包括:
在检测出存在所述故障情况时,发出提示信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810796601.6/2.html,转载请声明来源钻瓜专利网。