[发明专利]一种故障的检测方法和故障检测装置在审
| 申请号: | 201310324093.9 | 申请日: | 2013-07-30 |
| 公开(公告)号: | CN104348641A | 公开(公告)日: | 2015-02-11 |
| 发明(设计)人: | 陶勇 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
| 代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 故障 检测 方法 装置 | ||
技术领域
本发明涉及通信领域,尤其涉及一种故障的检测方法和故障检测装置。
背景技术
业务分发平台(Service Delivery Platform,SDP)是一种运营商发布各种网络能力的业务开放平台。第三方服务提供商(Service Provider,SP)/内容提供商(Content Provider,CP)通过SDP实现业务的开发、上线运营等。SDP作为业务运营管理中的核心平台,对平台容灾要求非常高。
现有技术中,容灾检测和容灾框架耦合在一起。由于SDP缺乏统一的信令接口,因此,容灾框架采用用户数据报协议(User Datagram Protocol,UDP)应答协议方式探测物理主机的状态判断生产节点是否存活。采用UDP应答协议方式探测生产节点是否存活时,容灾框架通过策略控制定期主动向物理主机发送报文,检测是否返回响应来判断生产节点是否存活;若超时没有返回响应,则判定生产节点故障。并且,容灾框架采用分布式部署,每个网元部署一套容灾框架,容灾框架只检测属于自己的网元节点的主机状态,网元故障的判定依据每一节点配置的故障权重来计算,如果超过权重门限,则认为网元故障,上报给容灾管理中心。
上述技术中,判断一个网元的每个生产节点是否存活时,采用UDP应答协议方式探测物理主机的状态,无法准确判定检测对象是否真正故障,进而利用该网元的每一节点配置的故障权重来确定网元故障时,缺乏对系统性能、网络和节点应用内部状态的检测,导致对系统故障的判断不准确。
发明内容
本发明的实施例提供一种故障的检测方法和故障检测装置,能够更为准确地检测系统故障。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明提供了一种故障的检测方法,该方法包括:
获取检测响应消息,所述检测响应消息中包括网元中每一节点的性能数据对应的至少一组检测数据,所述性能数据包括所述每一节点的应用状态数据、网络时延数据和进程数据中的至少一类数据;
利用节点故障检测算法对所述至少一组检测数据进行处理,获得所述每一节点的故障检测结果;
根据所述每一节点的故障检测结果,确定所述网元的故障状态。
在第一方面的第一种可能的实现方式中,根据第一方面,所述获取检测响应消息,所述检测响应消息中包括网元中每一节点的性能数据对应的至少一组检测数据具体包括:
接收容灾检测器代理发送的检测响应消息,所述检测响应消息中包括所述网元中每一节点的性能数据对应的至少一组检测数据,所述每一节点的性能数据对应的至少一组检测数据为所述每一节点发送给所述容灾检测器代理的。
在第一方面的第二种可能的实现方式中,根据第一方面,所述获取检测响应消息,所述检测响应消息中包括网元中每一节点的性能数据对应的至少一组检测数据具体包括:
接收所述每一节点发送的检测响应消息,所述检测响应消息中包括所述网元中每一节点的性能数据对应的至少一组检测数据。
在第一方面的第三种可能的实现方式中,结合第一方面或第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式,所述至少一组检测数据中的每组检测数据中包括至少一个采集对象和与所述至少一个采集对象对应的检测数据;
所述利用节点故障检测算法对所述至少一组检测数据进行处理,获得所述每一节点的故障检测结果具体包括:
将所述至少一组检测数据中的任一组检测数据中与所述至少一个采集对象对应的检测数据,或将所述至少一组检测数据中与所述至少一个采集对象对应的检测数据的平均值,与所述至少一个采集对象对应的第一预设门限值进行对比,以获得所述至少一个采集对象的故障状态;
根据预设的所述至少一个采集对象中每个采集对象的故障加权值,对所述至少一个采集对象的故障状态进行加权处理,以获得所述每一节点的加权处理结果;
将所述每一节点的加权处理结果与对应的第二预设门限值进行对比,以获得所述每一节点的故障检测结果。
在第一方面的第四种可能的实现方式中,根据第一方面的第三种可能的实现方式,所述至少一个采集对象对应的检测数据的平均值为根据所述至少一个采集对象的多个采集周期的检测数据获得的平均值。
在第一方面的第五种可能的实现方式中,结合第一方面或第一方面的第一种可能的实现方式至第一方面的第四种可能的实现方式,所述根据所述每一节点的故障检测结果,确定所述网元的故障状态具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310324093.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网关地址分配方法和设备
- 下一篇:一种交易无损的分布式部署方法及系统





