[发明专利]一种故障定位方法、装置、系统和存储介质在审
申请号: | 202210421748.3 | 申请日: | 2022-04-21 |
公开(公告)号: | CN114781510A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 裴冬冬;关德常;张志鹏;涂文芸;来宾;郭昊;林溢星;郝春雨 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F16/36;G06F11/07 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张思淼 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 定位 方法 装置 系统 存储 介质 | ||
本申请提供一种故障定位方法、装置、系统和存储介质,采用预先训练的卷积神经网络CNN算法模型对正则化的故障告警信息进行特征提取和分类,形成告警图谱,形成运维图谱,基础资源包括各IT应用系统的配置信息、变更信息和日志信息,通过告警图谱在运维图谱上的投影,对关联告警信息中的无关告警删除以得到最终告警拓扑关系,并对最终告警拓扑关系进行拓扑排序得到N个根源告警,根据配置信息变化情况、变更信息实施情况和日志信息出错情况计算得到N个根源告警各自对应的置信度,将置信度最大的根源告警作为最终根源故障点。从而基于最终告警拓扑关系,减少了无关告警的干扰,配合运维数据分析,提升了根源告警的置信度,提升了故障定位的准确性。
技术领域
本申请涉及计算机领域,特别涉及一种故障定位方法、装置、系统和存储介质。
背景技术
为了适应业务的快速发展,企业的IT(Information Technology,信息技术)应用系统和基础设施发生了巨大变革,其规模越来越大、架构越来越复杂,对集约化的IT运维带来了极大地挑战。
特别是当发生生产故障时,为了减少对业务影响,故障处置时间要求极短,这对故障处置提出了新的挑战。故障处置一般包括故障检测、故障定位和故障恢复三个阶段,其中,故障检测和故障恢复耗时短,故障定位耗时长。
我们通常采用监控告警来辅助发现和定位问题,但告警具有干扰性:为了避免告警漏报,往往要求告警应报尽报,会产生很多误报告警。在大规模、复杂架构之下,大量的干扰告警,加上人员数量和技能的限制,都会影响故障定位效率,不能快速准确的定位故障,从而问题得不到及时解决,影响业务的连续性。
发明内容
有鉴于此,本申请的目的在于提供一种故障定位方法、装置、系统和存储介质,可以实现快速准确的定位故障。
为实现上述目的,本申请有如下技术方案:
第一方面,本申请实施例提供了一种故障定位方法,包括:
获取各信息技术IT应用系统的初始故障告警信息;
对所述初始故障告警信息进行正则化处理得到正则化的故障告警信息;
采用预先训练的卷积神经网络CNN算法模型对所述正则化的故障告警信息进行特征提取和分类,将具有相同特征的所述正则化的故障告警信息作为关联告警信息;
根据所述关联告警信息发生时间的先后顺序建立初步实时告警拓扑关系,以形成告警图谱;
构建所述各IT应用系统之间的拓扑关系、所述各IT应用系统与基础资源之间的拓扑关系,和所述基础资源之间的拓扑关系,以形成运维图谱;所述基础资源包括所述各IT应用系统的配置信息、变更信息和日志信息;
通过所述告警图谱在所述运维图谱上的投影,对所述关联告警信息中的无关告警删除以得到最终告警拓扑关系,并对所述最终告警拓扑关系进行拓扑排序得到N个根源告警;所述N为正整数;
根据当前运维数据计算得到所述配置信息变化情况、所述变更信息实施情况和所述日志信息出错情况;
根据所述配置信息变化情况、所述变更信息实施情况和所述日志信息出错情况计算得到所述N个根源告警各自对应的置信度,将所述N个根源告警中对应的置信度最大的根源告警作为最终根源故障点。
在一种可能的实现方式中,所述方法还包括:
根据所述最终根源故障点,合并所述最终根源故障点对应的下游告警,作为合并故障点;
根据所述合并故障点进行告警。
在一种可能的实现方式中,所述采用卷积神经网络CNN算法对所述正则化的故障告警信息进行特征提取和分类之前,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210421748.3/2.html,转载请声明来源钻瓜专利网。