[发明专利]存储系统中的故障诊断方法及装置有效
申请号: | 201810158657.9 | 申请日: | 2018-02-24 |
公开(公告)号: | CN108334427B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 陈静 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/30 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美;胡明 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储系统 中的 故障诊断 方法 装置 | ||
1.一种存储系统中的故障诊断方法,所述存储系统包括至少一主控节点和多个存储节点,其特征在于,包括:
所述主控节点通过对所述存储系统中存储节点的运行状态进行监控,获取系统状态集合;
调用故障诊断模型对所述系统状态集合进行故障诊断,得到操作指令序列,所述故障诊断模型是通过所述存储系统已修复故障相关的系统状态集合和操作指令序列进行模型训练生成的;
根据所述操作指令序列中的操作指令进行所述系统状态集合所描述故障的修复;
所述方法还包括:
针对所述存储系统已修复故障,获取用于描述所述已修复故障的系统状态集合和用于修复所述已修复故障的操作指令序列;
通过所述存储系统已修复故障相关的系统状态集合和操作指令序列构造训练特征向量;
根据所述训练特征向量对指定模型进行模型训练,得到所述故障诊断模型。
2.如权利要求1所述的方法,其特征在于,所述主控节点通过对所述存储系统中存储节点的运行状态进行监控,获取系统状态集合,包括:
通过所述监控,获取监控时间段内所述存储系统中存储节点的运行状态数据;
处理所述运行状态数据得到所述系统状态集合。
3.如权利要求1所述的方法,其特征在于,所述通过所述存储系统已修复故障相关的系统状态集合和操作指令序列构造训练特征向量,包括:
进行所述操作指令序列的有效性检测,所述操作指令序列有效表示所述操作指令序列中的操作指令成功修复了所述已修复故障;
将所述系统状态集合、操作指令序列、检测结果拼接得到所述训练特征向量。
4.如权利要求3所述的方法,其特征在于,所述进行所述操作指令序列的有效性检测,包括:
当所述操作指令序列中的操作指令完成所述已修复故障的修复时,通过对所述存储系统中存储节点的运行状态进行监控,得到系统修复状态集合;
进行所述系统状态集合与系统修复状态集合之间的比较,通过所述比较检测所述操作指令序列的有效性。
5.如权利要求4所述的方法,其特征在于,所述当所述操作指令序列中的操作指令完成所述已修复故障的修复时,通过对所述存储系统中存储节点的运行状态进行监控,得到系统修复状态集合,包括:
确定修复所述已修复故障的修复时间,根据所述修复时间计算监控时间段;
通过所述监控,获取所述监控时间段内所述存储系统中存储节点的运行状态数据;
处理所述运行状态数据得到所述系统修复状态集合。
6.如权利要求4或5所述的方法,其特征在于,所述进行所述系统状态集合与系统修复状态集合之间的比较,通过所述比较检测所述操作指令序列的有效性,包括:
分别将所述系统状态集合中的修复前状态值与所述系统修复状态集合中的修复后状态值进行比较,得到比较结果,所述比较结果用于指示所述已修复故障完成修复后所述存储系统是否得到改善;
根据所述比较结果的指示计算系统改善率和系统恶化率;
如果所述系统改善率和系统恶化率满足指定标准,则检测得到所述操作指令序列有效。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司,未经腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810158657.9/1.html,转载请声明来源钻瓜专利网。