[发明专利]一种告警处理方法、系统、设备以及介质在审
申请号: | 202111007688.2 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113821404A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 丁麒森 | 申请(专利权)人: | 济南浪潮数据技术有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/32 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张涛;杨帆 |
地址: | 250000 山东省济南市中国(山东)自由贸易*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 告警 处理 方法 系统 设备 以及 介质 | ||
本发明公开了一种告警处理方法,包括以下步骤:接收业务节点触发告警规则后生成的告警信息;根据所述告警信息确定告警类型;根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。本发明还公开了一种系统、计算机设备以及可读存储介质。本发明提出的方案通过多个验证者节点对告警信息进行验证,可以提高监控的准确度和灵活性。
技术领域
本发明涉及服务器领域,具体涉及一种告警处理方法、系统、设备以及存储介质。
背景技术
在网络管理领域,故障被定义为产生功能异常的原因,是产生告警事件的原因。告警是在特定事件发生时被管对象发出的通报构成的一种事件报告,用于传递告警信息。它是生产厂商定义好的,并且是通过网络中的设备产生的,是一个系统发出的消息,表示其发生了某种事情或异常,最终被网络管理人员观察到。
理想的告警信息应包含有关故障设备名称、故障症状、发生部位、发生时间、发生原因等信息。但绝大部分告警都只有有关经历故障的设备名称、故障症状、发生时间等数据域,而没有提供识别故障必须的故障发生的详细地点和发生原因等数据域。
时延是指一个报文或分组从一个网络的一端传送到另一个端所需要的时间。它包括了发送时延,传播时延,处理时延,排队时延。(时延=发送时延+传播时延+处理时延+排队时延)一般,发送时延与传播时延是我们主要考虑的。对于报文长度较大的情况,发送时延是主要矛盾;报文长度较小的情况,传播时延是主要矛盾。
在实际中,机器本身的状态值随着BMC(Baseboard Management Controller,基板管理控制器)的重启等活动发生变化,影响告警的准确度。而在BMC重启期间,节点监测到传感器异常,产生无效告警某些阈值类告警无法用简单的级别来概括,需要更灵活的告警策略。又比如某业务重启,导致CPU占用率短暂提高,节点刚好捕捉到高点后产生无效告警。
由于监控节点和受控节点之间,可能存在较大的网络延迟或网络波动,导致网络请求丢失、数据采集响应缓慢等问题,导致告警不准确,空耗人力物力。
发明内容
有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种告警处理方法,包括以下步骤:
接收业务节点触发告警规则后生成的告警信息;
根据所述告警信息确定告警类型;
根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
在一些实施例中,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值,进一步包括:
每隔预设时间段利用其中一个所述验证者节点对所述告警信息进行验证以基于验证结果生成对应分值。
在一些实施例中,还包括:
对所述每一个验证者节点针对所述告警类型分别设置不同的权重;
判断当前已对所述告警信息进行验证的验证者节点的权重之和是否大于预设值;
响应于大于预设值,停止利用剩余的验证者节点继续对所述告警信息进行验证。
在一些实施例中,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分,进一步包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮数据技术有限公司,未经济南浪潮数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111007688.2/2.html,转载请声明来源钻瓜专利网。