[发明专利]应用于分布式系统的心跳检测装置和方法、网络设备有效
申请号: | 201210507305.2 | 申请日: | 2012-11-30 |
公开(公告)号: | CN102984029A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 熊俊 | 申请(专利权)人: | 福建星网锐捷网络有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/08;H04L1/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 350002 福建省福州市仓*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 分布式 系统 心跳 检测 装置 方法 网络设备 | ||
技术领域
本发明涉及网络通信技术,具体地,涉及一种应用于分布式系统的心跳检测装置和方法、网络设备。
背景技术
分布式系统是一种通信网络互联的多设备体系结构,各个设备通过协调交互来执行任务。分布式系统中包括多个设备,这多个设备中包括一个主设备,其它设备为子设备。
主设备和子设备之间通过心跳检测来监测子设备的生存状态。图1示出了心跳检测的原理示意,如图1所示,子设备2启动定时器(Timer),在定时器的定时周期到来时向主设备1发送心跳信息。主设备1接收到来自子设备2的心跳报文后更新对子设备2的心跳计数(counter),如果在规定的时间内,主设备1未接收到子设备2的心跳信息,认为子设备2故障,执行相应的故障处理。
心跳检测分为软件心跳检测和硬件心跳检测。软件心跳检测是通过软件触发定时器来发送心跳报文,硬件心跳是通过硬件触发来发送心跳报文。
硬件心跳检测通常采用硬件定时器对硬件心跳周期进行定时,在该定时器计时到时后,子设备向主设备发送硬件心跳报文,主设备在超过3个硬件心跳周期未接收到硬件心跳报文,认为子设备存在重启故障。其中,硬件定时器是低级中断定时器,不会因为中央处理器(CPU,Central Process Unit)繁忙而得不到调度,因而主设备通过硬件心跳报文只能检测出子设备的重启故障,无法检测出子设备的其它故障。
软件心跳检测能够弥补硬件心跳检测的空白。软件心跳由CPU触发,通常采用软件定时器对软件心跳周期进行定时,在该定时器计时到时后,子设备的CPU向主设备发送软件心跳报文,主设备在超过3个软件心跳周期未接收到硬件心跳报文,认为子设备过于繁忙,工作不正常,例如,子设备的程序陷入死循环,该陷入死循环的程序百分之百地占用了子设备的CPU的处理资源,这种情况下主设备判断子设备发生故障。
但是,在特定的条件下,子设备中的某些应用模块在做大量运算时,也可能会百分之百地占用CPU的处理资源,并且所表现出来的现象也是CPU的处理资源被百分之百占用,在这种情况下,CPU处于正常状态,子设备也没有发生故障,但是CPU不能触发软件心跳,子设备也不能向主设备发出软件心跳报文,主设备会对这种情况产生误判,认为子设备存在故障。
可见,现有的分布式系统的软件心跳检测中,对于子设备处于正常的CPU处理资源被百分之百占用的情况,存在主设备误判子设备存在故障的问题。
综上,在现有的分布式系统的心跳检测技术中,存在心跳检测存在误判、正确率低、可靠性低的问题。
发明内容
有鉴于此,本发明实施例提供了一种应用于分布式系统的心跳检测装置和方法、网络设备,用以解决现有的分布式系统的心跳检测技术中,所存在的心跳检测存在误判、正确率低、可靠性低的问题。
本发明实施例技术方案如下:
一种应用于分布式系统的心跳检测装置,包括:软件定时器,用于对预定的软件心跳周期进行计时;第一软件心跳触发器,用于在软件定时器计时到时后,向主设备发送软件心跳报文;监测模块,用于监测应用模块是否正常地占用中央处理器CPU的处理资源;第二软件心跳触发器,用于在监测模块监测到应用模块正常地百分之百占用CPU的处理资源、软件定时器无法计时软件心跳周期的情况下,向主设备发送软件心跳报文。
一种网络设备,包括如上所述的应用于分布式系统的心跳检测装置。
一种应用于分布式系统的心跳检测方法,包括:子设备在计时预定的软件心跳周期到时后,向主设备发送软件心跳报文;子设备监测自身上的应用模块是否正常地占用中央处理器CPU的处理资源;在监测到应用模块正常地百分之百占用CPU的处理资源、无法计时软件心跳周期的情况下,子设备向主设备发送软件心跳报文。
根据本发明实施例的技术方案,通过子设备监测子设备上应用模块是否正常地占用CPU的处理资源,并在监测到应用模块正常地百分之百占用对CPU的处理资源,且软件心跳周期无法计时的情况下,子设备向主设备发送软件心跳报文,能够在CPU的处理资源被正常地百分之百占用,软件心跳周期无法计时的情况下,仍然向主设备发送软件心跳报文,从而能够减少主设备对子设备的误判、提高心跳检测的正确率和可靠性,能够解决现有技术中心跳检测存在误判、正确率低、可靠性低的问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建星网锐捷网络有限公司,未经福建星网锐捷网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210507305.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:移动式玻璃仪器气流烘干装置
- 下一篇:一种退火复绕机除水装置