[发明专利]一种长短期预测融合的故障检测方法有效
申请号: | 201711453209.3 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108282360B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 刘雪琳;叶可江;须成忠 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;G06F11/34 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 赵勍毅 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 短期 预测 融合 故障 检测 方法 | ||
本发明属于信息技术领域,特别涉及一种长短期预测融合的故障检测方法,通过建立一个数据随时间变化的统计模型;再利用自回归模型对统计模型的预测残差值进行修正;接着利用马尔可夫预测模型对被修正后的统计模型进行趋势调整,最后采用广义似然比算法进行故障点检测,根据情况变化阈值预测故障报警。本发明既利用历史数据变化方式的总体规律信息,又利用当前实时数据的变化特征信息,建立一个长短期融合的故障预测模型,通过融合处理来降低单个预测方法的不确定性,发挥其自身的优越性,从而提高整体的故障预测准确性,保证了容器云的可靠性和服务质量的情况下,尽量减少或避免因为故障带来的损失。
技术领域
本发明属于信息技术领域,具体涉及一种长短期预测融合的故障检测方法。
背景技术
容器云是当前一种主流的云计算模式,其拥有启动速度快、资源消耗少等多方面的优势。容器云环境面临很大的可靠性挑战。一方面随着用户请求程序的增加以及程序复杂性的增加,程序容易出现异常;另一方面,云系统内部服务器的数目也在不断增加,同时,云计算基础设施一般采用比较低档的服务器或者PC机,单机的可靠性存在问题。因此容器云环境可能经常因为某些原因出现故障,这些故障进而破坏云环境,从而导致一个任务甚至是多个任务需要重新执行,严重影响了程序的正常运行。研究表明,在大规模集群中,有1-5%的硬盘会发生失效,服务器的失效率也达到了2-4%。对于一个新的集群来说将会有超过1000次的节点会产生失效,并且这种失效的次数会随着集群的增大而变得越来越多。根据上面的介绍可以得出,容器云平台出现故障对于程序的运行有重要影响。
目前,国内外已经就如何提高云环境稳定性进行了大量的研究。主要方法都是基于历史数据进行长期预测,然而一般长期模型利用较长的时间的数据,虽然满足了长期趋势的要求,但是缺乏对数据的实时性的把握,还是有一定的局限性。容器云平台复杂的结构导致故障发生概率显著增加,而传统的做法往往在故障发生后才能够使用常见的故障处理方法解决故障,这种滞后性使得一些损失不可避免。基于容器的云计算系统相比于传统的基于虚拟机的云计算系统在启动速度、资源消耗等方面更具优势,因此近年来很多大公司都采用容器技术来构建新的云计算系统。然而,随着容器云规模的不断扩大以及运行程序的种类的不断增多,如何保障容器云的安全可靠成为了一个突出的挑战。
因此,及时预测资源异常的趋势、有效检测资源状态、在故障产生显著影响前实施解救措施,故障的精准预测和及时检测能为整个容器云环境的安全可靠提供坚实的保障,是提高容器云服务质量的一种重要方法,也是目前云计算研究的热点和重点内容。
发明内容
针对以上问题,本发明旨在提供一种长短期预测融合的故障检测方法。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种长短期预测融合的故障检测方法,包括如下步骤:
S1:建立一个数据随时间变化的统计模型;
S2:利用时间序列建模得到的自回归模型,利用自回归模型对上述统计模型的预测残差值进行修正;
S3:利用马尔可夫预测模型作为长期建模方案,对被修正后的统计模型进行趋势调整。
S4:采用广义似然比算法进行故障点检测,根据情况变化阈值预测故障报警。
作为一种改进,所述步骤S1中“建立一个数据随时间变化的统计模型”还包括,为了消除日期,周数和月份对统计模型的影响,分别逐步加入总均值、日期的影响、周数的影响、月份的影响因素建立扩展统计模型。
作为进一步改进,扩展统计模型为:
yt=μ+αi+βw+γm (3)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711453209.3/2.html,转载请声明来源钻瓜专利网。