[发明专利]基于metaq集群的自动监控恢复方法有效
申请号: | 201711000405.5 | 申请日: | 2017-10-24 |
公开(公告)号: | CN107911230B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 谢二菊;周龙波 | 申请(专利权)人: | 丹露成都网络技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 成都三诚知识产权代理事务所(普通合伙) 51251 | 代理人: | 成实;曾娟 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于metaq集群的自动监控恢复方法,包括(1)进行前期准备;(2)利用python语言编写一个能够实现metaq发送消息的客户端;(3)将该客户端连接上该集群所注册的zookeeper集群;(4)客户端从zookeeper集群中获取所有的监控topic以及每个监控topic所在的服务器的IP;(5)客户端定时向每个监控topic发送一条空消息,若空消息全部发送成功则重复步骤(5),若有空消息发送失败则进行步骤(6)等步骤。本发明提供基于metaq集群的自动监控恢复方法,可以很好的完成对运维的监控,可以在发生线程等更底层的故障时及时的发现并进行重启恢复的操作,大大提高了监控的效果,保证了系统的正常运行。 | ||
搜索关键词: | 基于 metaq 集群 自动 监控 恢复 方法 | ||
【主权项】:
基于metaq集群的自动监控恢复方法,其特征在于:包括以下步骤:(1)进行前期准备;(11)准备若干台部署有metaq的服务器并在该服务器上创建相应的业务topic,将部署有metaq的服务器组成一个集群;(12)在每台metaq服务器上创建一个监控topic,且保证同一集群中的每台服务器上创建的监控topic均不相同;(13)将集群中的所有业务topic都至少在两台metaq服务器上进行创建;(14)将同一集群中的所有的metaq均注册到同一个zookeeper集群中;(2)利用python语言编写一个能够实现metaq发送消息的客户端;(3)将该客户端连接上该集群所注册的zookeeper集群;(4)客户端从zookeeper集群中获取所有的监控topic以及每个监控topic所在的服务器的IP;(5)客户端定时向每个监控topic发送一条空消息,若空消息全部发送成功则重复步骤(5),若有空消息发送失败则进行步骤(6);(6)客户端统计发送空消息失败的监控topic,并在该监控topic所在的统计变量上将失败次数+1,若该监控topic的失败次数未到3次,则返回步骤(5),若该监控topic的失败次数到达3次或3次以上,则进行步骤(7);(7)客户端检查失败3次或3次以上的监控topic所在服务器的上次重启时间,若重启时间与当前时间间隔未超过预设值则返回步骤(5),若重启时间与当前时间间隔超过预设值则进入步骤(8);(8)客户端检查当前时间是否在维护时间段,若当前时间在维护时间段则返回步骤(5),若当前时间不在维护时间段则进行步骤(9);(9)客户端调用失败3次或3次以上的监控topic所在服务器的系统命令以重启相应的metaq,并调用微信和邮件接口向预设的微信和邮箱发送告警信息,接着将该topic的失败次数信息清零并记录重启时间信息,最后再次返回步骤(5)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于丹露成都网络技术有限公司,未经丹露成都网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711000405.5/,转载请声明来源钻瓜专利网。