[发明专利]应用于分布式系统的心跳检测装置和方法、网络设备有效

专利信息
申请号: 201210507305.2 申请日: 2012-11-30
公开(公告)号: CN102984029A 公开(公告)日: 2013-03-20
发明(设计)人: 熊俊 申请(专利权)人: 福建星网锐捷网络有限公司
主分类号: H04L12/26 分类号: H04L12/26;H04L29/08;H04L1/00
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 黄志华
地址: 350002 福建省福州市仓*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用于 分布式 系统 心跳 检测 装置 方法 网络设备
【说明书】:

技术领域

发明涉及网络通信技术,具体地,涉及一种应用于分布式系统的心跳检测装置和方法、网络设备。

背景技术

分布式系统是一种通信网络互联的多设备体系结构,各个设备通过协调交互来执行任务。分布式系统中包括多个设备,这多个设备中包括一个主设备,其它设备为子设备。

主设备和子设备之间通过心跳检测来监测子设备的生存状态。图1示出了心跳检测的原理示意,如图1所示,子设备2启动定时器(Timer),在定时器的定时周期到来时向主设备1发送心跳信息。主设备1接收到来自子设备2的心跳报文后更新对子设备2的心跳计数(counter),如果在规定的时间内,主设备1未接收到子设备2的心跳信息,认为子设备2故障,执行相应的故障处理。

心跳检测分为软件心跳检测和硬件心跳检测。软件心跳检测是通过软件触发定时器来发送心跳报文,硬件心跳是通过硬件触发来发送心跳报文。

硬件心跳检测通常采用硬件定时器对硬件心跳周期进行定时,在该定时器计时到时后,子设备向主设备发送硬件心跳报文,主设备在超过3个硬件心跳周期未接收到硬件心跳报文,认为子设备存在重启故障。其中,硬件定时器是低级中断定时器,不会因为中央处理器(CPU,Central Process Unit)繁忙而得不到调度,因而主设备通过硬件心跳报文只能检测出子设备的重启故障,无法检测出子设备的其它故障。

软件心跳检测能够弥补硬件心跳检测的空白。软件心跳由CPU触发,通常采用软件定时器对软件心跳周期进行定时,在该定时器计时到时后,子设备的CPU向主设备发送软件心跳报文,主设备在超过3个软件心跳周期未接收到硬件心跳报文,认为子设备过于繁忙,工作不正常,例如,子设备的程序陷入死循环,该陷入死循环的程序百分之百地占用了子设备的CPU的处理资源,这种情况下主设备判断子设备发生故障。

但是,在特定的条件下,子设备中的某些应用模块在做大量运算时,也可能会百分之百地占用CPU的处理资源,并且所表现出来的现象也是CPU的处理资源被百分之百占用,在这种情况下,CPU处于正常状态,子设备也没有发生故障,但是CPU不能触发软件心跳,子设备也不能向主设备发出软件心跳报文,主设备会对这种情况产生误判,认为子设备存在故障。

可见,现有的分布式系统的软件心跳检测中,对于子设备处于正常的CPU处理资源被百分之百占用的情况,存在主设备误判子设备存在故障的问题。

综上,在现有的分布式系统的心跳检测技术中,存在心跳检测存在误判、正确率低、可靠性低的问题。

发明内容

有鉴于此,本发明实施例提供了一种应用于分布式系统的心跳检测装置和方法、网络设备,用以解决现有的分布式系统的心跳检测技术中,所存在的心跳检测存在误判、正确率低、可靠性低的问题。

本发明实施例技术方案如下:

一种应用于分布式系统的心跳检测装置,包括:软件定时器,用于对预定的软件心跳周期进行计时;第一软件心跳触发器,用于在软件定时器计时到时后,向主设备发送软件心跳报文;监测模块,用于监测应用模块是否正常地占用中央处理器CPU的处理资源;第二软件心跳触发器,用于在监测模块监测到应用模块正常地百分之百占用CPU的处理资源、软件定时器无法计时软件心跳周期的情况下,向主设备发送软件心跳报文。

一种网络设备,包括如上所述的应用于分布式系统的心跳检测装置。

一种应用于分布式系统的心跳检测方法,包括:子设备在计时预定的软件心跳周期到时后,向主设备发送软件心跳报文;子设备监测自身上的应用模块是否正常地占用中央处理器CPU的处理资源;在监测到应用模块正常地百分之百占用CPU的处理资源、无法计时软件心跳周期的情况下,子设备向主设备发送软件心跳报文。

根据本发明实施例的技术方案,通过子设备监测子设备上应用模块是否正常地占用CPU的处理资源,并在监测到应用模块正常地百分之百占用对CPU的处理资源,且软件心跳周期无法计时的情况下,子设备向主设备发送软件心跳报文,能够在CPU的处理资源被正常地百分之百占用,软件心跳周期无法计时的情况下,仍然向主设备发送软件心跳报文,从而能够减少主设备对子设备的误判、提高心跳检测的正确率和可靠性,能够解决现有技术中心跳检测存在误判、正确率低、可靠性低的问题。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建星网锐捷网络有限公司,未经福建星网锐捷网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210507305.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top