[发明专利]一种实现故障定位的方法及装置在审
申请号: | 201310711392.8 | 申请日: | 2013-12-20 |
公开(公告)号: | CN104734871A | 公开(公告)日: | 2015-06-24 |
发明(设计)人: | 郭宪杰;申山宏;刘淑霞;尚尔刚 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 田红娟;龙洪 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 故障 定位 方法 装置 | ||
技术领域
本发明涉及网络管理技术,尤指一种实现故障定位的方法及装置。
背景技术
现有的网络管理系统用于管理各个监控对象。通常需要通过网络配置功能配置监控对象的各个参数,包括监控对象的名称标识、连接关系等。比如监控对象为一个交换机和四台计算机,交换机连接这四台计算机。有了这个配置数据后,就认识了管理系统的各个对象,通常是根据标识名称来识别监控对象的,如Switcher100,Computer100,Computer101,Computer102,Computer103等。
通常对监控对象的监控结果达到故障阈值后会上报给维护人员,比如CPU利用率达到96%以上需要报警,这个时候监控对象就会向监控者(网络管理系统)发送一条消息,消息包括:对象类型、对象标识、监控的指标、当前指标值、告警名称等信息。比如Computer,ID=100,CPU,98%,计算机CPU利用率过高。从网络管理系统来看,这些告警数据都是来自各个被监控对象上报的,消息类型是可以自定义的。
告警数据由监控对象上报后,根据接口定义,会获取消息类型、消息对象和对象标识,如上面提到的收到一条“Computer,ID=100,CPU,98%,计算机CPU利用率过高”,就会知道是Computer100出现了异常情况。
在复杂的真实的网络中,一个故障会导致更多的监控对象发生故障,典型的如掉电后,所有的监控对象可能都无法正常工作了;传输线路中断导致一片区域的通信受阻。可能就是在一两分钟内会上报上百条告警信息,在这些上报的告警数据中,如果快速定位根源的告警数据,对其优先进行修复,其它告警数据可能就会自动恢复了。如何快速定位根源性的告警数据就是现有技术的分析重点,通常是根据网络监控对象之间的连接关系(如Switcher100连接了Computer100等4台)、业务之间的因果关系(掉电和低压等有前后或者因果关系),归纳这些连接关系、因果关系形成告警知识库或者经验规则,利用既有的告警知识库或者告警经验规则对告警数据进行故障定位与分析。
利用既有的告警知识库或者告警经验规则对告警数据进行故障定位与分析,是现有网络维护的主要方法。但是现有的方法应用在全网络的监控中会带来海量的告警数据,并且跨网络设备跨管理系统之间的告警关联分析难度非常大。特别是周期性的网络建设和持续性地日常维护使得网络始终处于动态变更的过程当中,而面对动态的网络配置变更会给先验的告警经验规则带来很大的不准确性,无法快速、准确的进行根源故障的定位,无法提升日常网络维护和挂账派单过程中的效率。
发明内容
为了解决上述技术问题,本发明提供了一种实现故障定位的方法及装置,能够快速、准确的进行根源故障的定位,提升日常网络维护和故障派单过程中的效率。
为了达到上述发明目的,本发明公开了一种实现故障定位的方法,包括:
获取当前故障信息,当前故障信息至少包括监控对象、故障类型和时间信息;
根据获得的当前故障信息,建立所有监控对象针对不同故障类型在不同时间点的预定时间窗内的传导链集合;
对建立的传导链集合中的传导链之间的相关性进行分析,获得所有监控对象针对不同故障类型的故障对象传导链;
根据获得的故障对象传导链,定位出当前的故障对象和故障类型。
优选地,上述方法还可以具有如下特点:所述获取当前故障信息之前还包括:根据获得的历史故障信息,建立故障元数据库。
优选地,上述方法还可以具有如下特点:所述建立传导链集合之前,该方法还包括:判断所述当前故障信息是否存在于所述历史故障信息中;
优选地,上述方法还可以具有如下特点:所述建立所有监控对象针对不同故障类型在不同时间点的预定时间窗内的传导链集合包括:
获取所述监控对象针对当前故障类型在当前时间点的预定时间窗内的传导链;
根据所述历史故障信息建立当前监控对象针对当前故障类型在不同时间点的预定时间窗内的传导链集合。
优选地,上述方法还可以具有如下特点:所述对传导链集合中的传导链之间的相关性进行分析,获得所有监控对象针对不同故障类型的故障对象传导链,包括:
分别获得所述传导链集合中每个监控对象发生每种故障的次数,计算每个监控对象发生该故障的次数在所有监控对象发生故障的总次数中的比值,将所述比值大于预定阈值的监控对象列表作为故障对象传导链。
优选地,上述方法还可以具有如下特点:当判断出所述当前故障信息不存在于所述历史故障信息中时,该方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司;,未经中兴通讯股份有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310711392.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种GOOSE通信方法及装置
- 下一篇:网络中生成宽带网络网关池的方法和装置