[发明专利]一种基于变权重随机森林的硬盘故障预测方法及系统在审
申请号: | 202110411800.2 | 申请日: | 2021-04-16 |
公开(公告)号: | CN112951311A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 李国;常甜甜 | 申请(专利权)人: | 中国民航大学 |
主分类号: | G11C29/12 | 分类号: | G11C29/12;G06N3/00;G06N5/00;G06N3/08 |
代理公司: | 天津市鼎和专利商标代理有限公司 12101 | 代理人: | 蒙建军 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 权重 随机 森林 硬盘 故障 预测 方法 系统 | ||
本发明公开了一种基于变权重随机森林的硬盘故障预测方法及系统,属于信息处理技术领域,其特征在于,包括如下步骤:步骤一:数据预处理:决策树的节点分裂信息值可能为0,将分裂信息值与分裂信息平均值之和来代替单一的分裂信息值;步骤二:根据精度A和多样性值K选取决策树Ti;步骤三:根据决策树Ti的分类准确率计算其权重w(Ti);步骤四:构建变权重随机森林模型对硬盘进行预测。本发明提高了故障检测率的同时,大大降低了误报率,与其他现有方案相比具有一定的优越性,为硬盘故障的预测问题提供了新的解决思路。同时,大大延长了故障硬盘的提前预测时间,为之后的有效数据迁移提供了充足的时间,从而达到了保护数据的目的。
技术领域
本发明属于信息处理技术领域,特别是涉及一种基于变权重随机森林的硬盘故障预测方法及系统。
背景技术
如今,越来越多的工业级机构依靠数据中心来存储和处理数据。数据中心的崩溃可能会导致巨大的损失甚至会导致灾难性的后果。据统计,硬盘是数据中心最大的故障源之一,仅硬盘故障就占取数据中心所有硬件故障的71.1%。因此,采取一些措施来处理硬盘故障问题是十分迫切的。
自我检测、分析和报告技术(SMART)普遍应用于硬盘中,以监视和分析硬盘的内部属性。研究表明,通过使用SMART属性来预测即将发生的故障这种主动容灾机制是可行的。为了提高硬盘故障的预测准确度,已经基于SMART属性做出了许多努力,其中就包括分析硬盘驱动器的故障行为,设计用于预测硬盘故障的机器学习算法。这些工作大部分都集中在硬盘故障的主动检测上,可以预先检测硬盘故障,并给出二进制的结果,将硬盘确定为健康盘和故障盘。
近年来,研究者尝试使用其他统计学和机器学习方法结合来解决硬盘故障预测问题。
李静等人使用决策树(DT)和梯度提升回归树(CBRT)两种模型对硬盘进行了故障预测,在168196块硬盘的实际数据集上进行实验,最终DT在误判率低于0.01%的情况下,取得了超过93%的预测准确率,CBRT在不出现误判率的情况下,取得了90%的预测准确率。
王梓杰等人提出一种基于主成分分析(PCA)与随机森林算法的轴承故障趋势预测方法,把预测结果与BP神经网络模型预测的结果进行对比,结果表明随机森林在故障趋势预测上在精度相较于BP神经网络有显著提高,是一种有效的故障趋势预测方法。史干东等人使用随机森林算法对异步电动机转子断条进行故障诊断,经实验得出该方法性能良好。Rajhans Gondane等人使用概率随机森林对不同数据集进行分类实验,在许多基准数据集上报告的实验结果表明,与随机森林相比,提出的概率随机森林能够实现更好的性能。杨冬英为解决在故障诊断中数据不均衡的问题提出了一种精确度加权随机森林算法,经实验得出该算法简化随机森林计算的复杂度,加快程序运行,降低故障诊断的错误率。
发明内容
技术方案,为了解决上述背景技术中的技术问题:
本发明的第一目的是提供一种基于变权重随机森林的硬盘故障预测方法,包括:
步骤一:数据预处理:考虑到决策树的节点分裂信息值可能为0的情况,提出分裂信息值与分裂信息平均值之和来代替单一的分裂信息值。
步骤二:根据精度A和多样性值K选取优秀的决策树。在随机森林预测模型的构建过程中,随着决策树的数量增加,并不会影响整体模型产生过拟合现象,且预测效果并不会随着决策树数量的增加而变得更好。但是当决策树数量增加到一定数量时,会影响随机森林整体模型的运行效率,从而影响最终的分类结果。故而选取性能较优的决策树,去除性能不理想的决策树是十分必要的。
步骤三:根据决策树Ti的分类准确率计算其权重w(Ti)。
步骤四:构建变权重随机森林模型对硬盘进行预测。
优选地:步骤一的计算方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国民航大学,未经中国民航大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110411800.2/2.html,转载请声明来源钻瓜专利网。