[发明专利]一种自动获取故障的方法及系统有效
申请号: | 201810949687.1 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109117374B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 孙伟 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 韩洪淼 |
地址: | 250000 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 获取 故障 方法 系统 | ||
本发明提供一种自动获取故障的方法及系统,方法包括如下步骤:采集应用程序的通用指标,每间隔采集时间段采集一次,形成应用程序的通用指标序列;判断采集的通用指标数量是否达到设定数量K;若采集的通用指标数量达到设定数量K,则采用滑动窗口获取不同时间段的通用指标序列数据;计算不同时间段的通用指标序列数据的平稳性;根据通用指标序列数据的平稳性判断是否有通用指标序列故障。系统包括采集模块、指标数量判断模块、不同时间段的通用指标序列数据获取模块、通用指标序列数据的平稳性计算模块、通用指标序列故障判断模块以及报警模块。本发明减少了现有程序的维护成本实现发现更多隐藏的故障的发现。
技术领域
本发明属于互联网监控领域,具体涉及一种自动获取故障的方法及系统。
背景技术
在互联网时代,我们有大量的后台程序在持续地运行,及时发现这些程序的故障并自动化处理,是互联网业务持续稳定提供服务的前提,这就是“故障发现”的重要之处。然而,现在的服务越来越多,越来越复杂,要做到自动化处理故障,首先现故障,这就为广大互联网企业提出了挑战。
为了监控到服务故障,最低端的“故障发现”,是依赖于相关技术人员对业务和程序的了解,把他们的相关知识写成程序,通过监控一些特殊的指标来达到“故障发现”的目的,例如针对 MySQL 数据库服务,有 MySQL 的监控程序,针对 Oracle 数据库服务,则有另一套监控程序。这种做法有一个明显的优点,那就是针对性强。因为这个程序就是为了这个事情而写的。相应地,以上做法也有明显的缺点:监控的质量,取决于写程序的人的专业程度,越高级的工程师,写出来的程序效果越好;这也就说,如果对相应的程序或服务了解不深刻,写出的监控程序可能需要不断进化才能达到期望的效果,这期间可能会有“漏报”;不可复制性,增加一个新的程序或业务,都需要有专门的人来写一个对应的监控程序来做“故障发现”,不具有通用性;相应的,维护成本也只会持续增加。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种自动获取故障的方法及系统,是非常有必要的。
发明内容
本发明的目的在于,针对上述故障依赖于相关技术人员对业务和程序的了解,不具有通用性,监控质量不统一,且不可复制的缺陷,提供一种自动获取故障的方法及系统,以解决上述技术问题。
为实现上述目的,本发明给出以下技术方案:
一种自动获取故障的方法,包括如下步骤:
采集应用程序的通用指标,每间隔采集时间段采集一次,形成应用程序的通用指标序列;
判断采集的通用指标数量是否达到设定数量K;
若采集的通用指标数量达到设定数量K,则采用滑动窗口获取不同时间段的通用指标序列数据;
计算不同时间段的通用指标序列数据的平稳性;
根据通用指标序列数据的平稳性判断是否有通用指标序列故障。
进一步地,判断采集的通用指标数量是否达到设定数量K;
当采集的通用指标数量小于等于设定数量K时,返回采集应用程序的通用指标步骤。如果通用指标数量少于 K个,说明程序启动没有多久,还在预热,相关数据不足以支持研判,暂不处理。
进一步地,根据不同时间段的通用指标序列数据的平稳性,判断是否有通用指标序列故障之后还包括如下步骤:
当某个通用指标序列故障时,发出报警,输出故障的应用应用程序及故障的应用应用程序对应的指标。通过报警发现哪个应用程序的哪个指标出了异常,就完成了故障发现的自动化。
进一步地,采用滑动窗口获取不同时间段的通用指标序列数据,具体步骤如下:
采用滑动窗口获取通用指标序列中时间段最新的m个数据,mK,形成序列Y_new;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810949687.1/2.html,转载请声明来源钻瓜专利网。