[发明专利]运行状态监控方法、装置、大数据集群和存储介质在审
申请号: | 202211279682.5 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115687009A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 张东林;钱浩东;张淑云;周明伟 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 杭州华进联浙知识产权代理有限公司 33250 | 代理人: | 黄文勇 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运行 状态 监控 方法 装置 数据 集群 存储 介质 | ||
本申请涉及一种运行状态监控方法、装置、大数据集群和存储介质,其中,该运行状态监控方法包括:对目标指标在当前监控周期内的运行状态信息进行拟合,得到目标指标在当前监控周期对应的状态变化信息;对状态变化信息进行导数求解,得到目标指标的走向,并基于状态变化信息预测目标指标在预设预测时段后的预测数值。其实现了对目标指标走向趋势的预测,从而能够及时针对目标指标的走向趋势采取前置处理,进而消除了对集群运行状态的监控的滞后性。
技术领域
本申请涉及大数据集群的监控运维领域,特别是涉及运行状态监控方法、装置、大数据集群和存储介质。
背景技术
目前,随着数据的爆炸式增长,基于大数据集群实现数据清洗、挖掘、分析的解决方案,已经在现代化社会治理、疾病预防控制等领域得到了充分应用。其中,基于云原生方案的大数据集群服务已经成为了目前大数据应用的主流方式。随着集群规模的扩大,对集群异常的排查和修复将耗费较多人力和时间,并导致集群业务中断,无法对外提供服务。
目前,对集群的运维监控技术往往是为每一种监控指标设置一个阈值,在监测到指标数值超出对应阈值后产生告警。该种方式只能在监控指标超出阈值后触发告警,缺乏对运行状态及时采取前置处理的能力,从而导致对集群运行状态的监控存在滞后性。
针对相关技术中对集群的运行状态的监控存在滞后性的问题,目前还没有提出有效的解决方案。
发明内容
在本实施例中提供了一种运行状态监控方法、装置、大数据集群和存储介质,以解决相关技术中对集群的运行状态的监控存在滞后性的问题。
第一个方面,在本实施例中提供了一种运行状态监控方法,包括:
对目标指标在当前监控周期内的运行状态信息进行拟合,得到所述目标指标在所述当前监控周期对应的状态变化信息;
对所述状态变化信息进行导数求解,得到所述目标指标的走向,并基于所述状态变化信息预测所述目标指标在预设预测时段后的预测数值。
在其中的一些实施例中,所述对目标指标在当前监控周期内的运行状态信息进行拟合,得到所述目标指标在所述当前监控周期对应的状态变化信息,包括:
基于所述目标指标的预设的灵敏度,确定拟合阶数;
对所述目标指标在当前监控周期内的运行状态信息进行所述拟合阶数的拟合,得到所述目标指标在所述当前监控周期对应的状态变化信息。
在其中的一些实施例中,在对所述状态变化信息进行导数求解,得到所述目标指标的走向,并基于所述状态变化信息预测所述目标指标在预设预测时段后的预测数值之后,所述方法还包括:
根据所述目标指标的走向、所述预测数值、以及预设的告警事件发生阈值,判断所述目标指标是否在所述预设预测时段后会发生告警事件;
在确定所述目标指标在所述预设预测时段后会发生所述告警事件的情况下,针对所述告警事件提前进行告警。
在其中的一些实施例中,所述根据所述目标指标的走向、所述预测数值、以及预设的告警事件发生阈值,判断所述目标指标是否在所述预设预测时段后会发生告警事件,包括:
在所述目标指标的走向为递减或为先递增后递减、且所述预测数值低于预设的告警事件发生的下限阈值的情况下,确定所述目标指标在所述预设预测时段后会发生所述告警事件。
在其中的一些实施例中,所述根据所述目标指标的走向、所述预测数值、以及预设的告警事件发生阈值,判断所述目标指标是否在所述预设预测时段后会发生告警事件,还包括:
在所述目标指标的走向为递增或为先递减后递增、且所述预测数值高于预设的告警事件发生的上限阈值的情况下,确定所述目标指标在所述预设预测时段后会发生所述告警事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211279682.5/2.html,转载请声明来源钻瓜专利网。