[发明专利]一种服务器故障检测方法无效
| 申请号: | 201210393590.X | 申请日: | 2012-10-16 |
| 公开(公告)号: | CN103731315A | 公开(公告)日: | 2014-04-16 |
| 发明(设计)人: | 张焰 | 申请(专利权)人: | 无锡云捷科技有限公司 |
| 主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/14 |
| 代理公司: | 无锡互维知识产权代理有限公司 32236 | 代理人: | 庞聪雅 |
| 地址: | 214192 江苏省无锡*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 服务器 故障 检测 方法 | ||
【技术领域】
本发明是关于计算机网络服务器领域,特别是关于网络服务器的故障检测领域。
【背景技术】
现有传统的服务器故障容错系统中,通常采用心跳机制实现服务器故障的检测,其具体实现机理如下:
在被检测服务器和检测服务器之间连接一条专用的网线,即所谓的“心跳线”,此心跳线仅为故障检测发送检测信息之用,不作为应用数据传输之用,因此在服务器上都有两块网卡,一块用于连接心跳线,另一块则用于应用数据线路。检测服务器通过心跳线每隔一定的间隔时间向被检测服务器发送一个ICMP消息,即Ping方式来检查被检测服务器的健康状况。
如果检测服务器每次ping后都能从被检测服务器得到回应,则表明被检测服务器是正常的,反之则表明被检测服务器发生故障,从而可以决定进一步的容错处理。
快速正确地检测出被检测服务器的故障,是整个容错系统中最重要的环节,如果出现误判,就会给用户带来重大损失。
传统的故障检测机制(心跳机制)在服务器故障识别上存在很大的局限性:
(1)无法检测出应用数据所使用的网络接口的故障,因为心跳线采用独立与应用数据网线的专用的网卡和网线,如果数据网络(网卡或网线等)发生故障,这种情况下是无法检测出来的。
(2)无法检测出应用服务程序本身是否发生异常,心跳机制采用发送ICMP协议消息(Ping)的方式检测对方服务器的健康状况,这种Ping方式实事上只能检测出被检测服务器的操作系统是否正常运行。
(3)如果心跳线本身出现故障,该容错系统将无法正常工作。
(4)无法对可能发生硬件性能瓶颈提前判断。
采用心跳检测机制的容错系统中无法检测应用程序的故障,无法检测应用数据所使用的网络故障,同时在心跳线自身故障时,将无法正常行使故障检测功能。因此有必要对现有的技术进行改进。
【发明内容】
本发明的目的在于针对现有技术的缺陷提出一种可以全方位解决服务器故障检测的方法,极大地提高服务器故障检测的准确率,即使在检测系统自身发生故障也能正常工作和行使故障检测的功能。
为达成前述目的,本发明一种服务器故障检测方法,其包括:
首先建立网络服务器池,其中服务器池是由一组具有相同功能,并被统一管理起来的服务器组成,网络中设立至少两台检测服务器,其中该检测服务器负责将多台服务器组成一个虚拟的服务器池,并对服务器的运行状态进行实时监控和采集;
任意服务器启动后首先通过向其中一台所述检测服务器发送登记消息进行登记,其中该登记消息中包含有服务自身的相关信息,包括:池名、唯一的服务识别号、服务器IP地址、服务端口、服务协议、服务检测;
检测服务器收到登记消息后,立刻以登记回应消息回复,并将其中的信息进行归类保存在服务器列表中,同时将该信息内容通过服务器更新消息发送给其他检测服务器;
服务器在某台池化器登记完成后,该台池化器将负责对此服务器进行周期性健康状况检查,每隔一个固定的时间间隔向该服务器发送持续活动消息;
服务器接到持续活动消息后,立刻以持续活动确认消息回复给池化器。在持续活动确认消息中服务器附带了自身的相关状态信息,包括:CPU使用率、网络使用率、内存使用率、硬盘使用率;检测服务器根据所述服务器自身的相关信息判断服务器的状态;
如果池化器发出的持续活动消息,在设定时间内没有收到持续活动确认消息,则迅速连续发送几个持续活动消息,如果仍然没有收到持续活动确认消息,则可以判定服务器发生故障。
根据本发明的一个实施例,前述检测服务器根据所述服务器自身的相关信息判断服务器的状态包括,当所述服务器的CPU使用率、网络使用率、内存使用率、硬盘使用率超过预定值时,检测服务器判定该服务器为故障服务器。
根据本发明的一个实施例,当服务器启动后向检测服务器发送的登记消息中服务检测为开时,检测服务器对该服务器进行周期性的服务可用性探测,方法是向该服务器指定的IP和端口按照其服务协议发送探测消息,然后通过服务器的回应判断其服务正常与否。
根据本发明的一个实施例,所述服务器的回应包括服务器状态码,检测服务器如果收到的服务器状态码为正常,则表明该服务器的服务是正常的,反之可以判断出该服务器的服务异常,即该服务器发生故障。
根据本发明的一个实施例,其还包括检测服务器主动探测服务器指定的IP和端口,如果此时检测法务器无法与服务器建立TCP连接,则能够判断该服务器的服务出现故障。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡云捷科技有限公司,未经无锡云捷科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210393590.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种规模养鸽自动饮水系统低压区专用减压阀
- 下一篇:一种活塞式气体稳压阀





