[发明专利]一种基于变点小波法的硬盘失效分析方法有效
申请号: | 202110415523.2 | 申请日: | 2021-04-18 |
公开(公告)号: | CN113157506B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 李肖坚;王海兰;张佳佳;杨昊澎;廖富;梁煌 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 冀学军 |
地址: | 541504 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 变点小波法 硬盘 失效 分析 方法 | ||
本发明公开了一种用于提取硬盘运行状况的变点小波方法,首先时序化硬盘运行状况并剔除常量,生成硬盘SMART时序特征;其次用线性内插法填充时序特征的空缺值;其二用归一化方式等值化时序特征;其三分解出硬盘SMART时序特征的小波;其四并以可视化方式呈现小波形态的不同频率;最后用卷积网络与长短记忆网络验证变点小波具有表征硬盘失效的有效性。该方法不仅能处理含缺失值的硬盘运行状况日志还能提取出具有指示硬盘失效的变点小波特征。从而实现从硬盘运行状况日志中提取小波,用小波预测硬盘的健康状况,获得了提高预测准确率和精准率的技术效果。
技术领域
本发明涉及一种用于提取云服务器中硬盘运行状况的变点小波方法,该方法属于大数据挖掘的技术领域。
背景技术
硬盘运行状况日志是记录硬盘从启用到死亡的运行状态的信息,用SMART(Self-Monitoring Analysis and Reporting Technology,简称SMART)特征值表示硬盘运行的状态。而硬盘运行状况日志中的SMART特征信息主要是由制造商提供,当前尚不能直接从SMART特征中了解硬盘失效前表现出的突变症状。
硬盘失效给供应商和用户带来巨大的经济损失,硬盘失效不仅会导致用户的数据不可用,甚至永久性的丢失数据,还会导致服务器宕机,且已有研究指出硬盘失效是导致服务器失效的主要原因。硬盘失效有两种情况,一种是突然失效,另一种是随着时间的增长逐渐失效。
变点是指样本序列在某特性上的观察值发生异常变化的样本位置,这种突然变化往往反映事物的某种质的变化。目前分析变点特性的硬盘失效特征方法,主要有两种,第一种是基于统计方法分析硬盘运行状况,如用贝叶斯变点检测、参数估计等来揭示硬盘运行状况数据集中的均值、方差、趋势、概率等突变;第二种是用机器学习方法建立回归模型,拟合硬盘失效特征的衰退过程。
然而在不同的时间维度和空间维度上硬盘的失效特征值都是非均匀随机分布,虽然用传统的统计方法从均值、方差、趋势、概率等角度分析变点特征,取得一定效果,但由于传统的统计方法主要依靠假设检验理论,若假设不成立,则很难用传统的统计方法对失效特征建模。
且硬盘运行状况日志中存在严重的数据不平衡和空缺值问题,数据不平衡是指失效硬盘数量与正常硬盘数量的比例严重失衡;空缺值是指日志记录中含有空值。因此现有的分析变点特性方法尚不能直接处理含空缺值的硬盘运行状况日志。
如何从硬盘运行状况日志中提取硬盘失效的重要特征,是本发明有待解决的技术问题。
发明内容
本发明的目的是提取具有指示性的变点小波特征来表征硬盘失效。为了解决现有技术的问题,本发明提出一种基于变点小波法的硬盘失效分析方法。具体步骤有:
解读硬盘运行状况日志,明确硬盘运行状况日志的每一个记录的各字段含义的步骤;
剔除硬盘运行状况日志中的常量,并将硬盘运行状况SMART特征值按其采样的时间,先后顺序排列,生成可用的时序特征的处理步骤;
填充空缺值,计算空缺值的前后两个位置上值的平均值,作为空缺位的值的处理步骤;
用最大-最小值的归一化方法,等值化时序特征的处理步骤;
用小波变换方法,提取时序特征的变点小波的处理步骤;
以可视化方式呈现不同频率下的变点小波的形态的处理步骤;
验证变点小波具有预示硬盘失效的显著性。
本发明基于变点小波法的硬盘失效分析方法的优点在于:
①将硬盘运行状况SMART特征值按其采样的时间先后顺序排列,生成可用的时序特征。
②用线性内插法填充时序特征的空缺值,插入的值更接近时序特征的常态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110415523.2/2.html,转载请声明来源钻瓜专利网。