[发明专利]一种监控多台服务器的监控系统及监控方法有效
申请号: | 201210459086.5 | 申请日: | 2012-11-14 |
公开(公告)号: | CN103001824A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 曾文杰;刘浩;冯顾;胡宇;华起 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/08 |
代理公司: | 北京市浩天知识产权代理事务所 11276 | 代理人: | 靳春鹰;刘云贵 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监控 服务器 系统 方法 | ||
技术领域
本发明涉及计算机技术领域,具体涉及一种监控多台服务器的监控系统及监控方法。
背景技术
随着网络的快速发展,出现了需要为大量用户服务的网络系统。这些网络系统具有分布在各个地址的大量服务器,而这些服务器通常构建为集群的方式来为用户服务。随着提供服务的服务器越来越多,如何对这些服务器的性能进行监控成为目前需要迫切解决的问题。
目前比较普遍采用的监控系统主要有Cacti监控系统和Ganglia监控系统。
Cacti监控系统是基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具。它用PHP语言实现,并通过RRDTool而使使用者感觉更方便。它主要是通过snmp获取数据,然后用RRDTool储存和更新数据,当用户需要查看数据的时候用RRDTool生成图表呈现给用户,但并不需要了解RRDtool复杂的参数。因此,snmp和RRDTool是cacti的关键。其中snmp关系着数据的收集,RRDTool关系着数据存储和图表的生成。
Cacti除了基本的snmp流量和系统资讯监控外,还可外挂Scripts及加上模板来作出各式各样的监控图。另外,MySQL配合PHP可以存储一些变量数据并对变量数据进行调用,如:主机名、主机IP、snmp团体名、端口号、模板信息等变量。
Cacti将snmp获取的数据存储在RRDTool生成的rrd文件中。RRDTool对数据的更新和存储就是对rrd文件的处理,rrd文件是大小固定的档案文件(Round Robin Archive),它能够存储的数据笔数在创建时就已经定义。因此,它存在着可扩展性差、可复用性低、可靠性低的问题,另外,由于只能存储少量的历史数据,所以难以查看长期的历史数据。
Ganglia监控系统是UC Berkeley发起的一个跨平台可扩展的,高性能计算系统下的开源集群监控系统,它是基于分层设计,用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。它主要用来监控系统性能,如:cpu、mem、硬盘利用率,I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态。
然而,Ganglia没有内置的通知系统,需要另外开发通知报警机制才能实现通知报警功能,另外,其采用RRDTool工具绘制图形,消耗服务器大量内存。还有,由于只能存储少量的历史数据,所以难以查看长期的历史数据。
现有的监控系统都没有考虑到在用于监控大规模服务器时会面临的负载问题,也没有考虑到如何使得监控系统可以扩展来适应所监控服务器的大规模扩展。此外,现有的监控系统没有考虑到当服务器的被监控数据越来越多时,如何对监控数据进行提取和分析,以便快速向管理员报警。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的监控多台服务器的监控系统和相应的监控方法。
依据本发明的一个方面,提供了一种适于监控多台服务器的监控系统,其包括:多个数据收集客户端,每个数据收集客户端布置在每台对应被监控的服务器中,适于采集所述被监控的服务器的运行数据,并发送该运行数据;信号过滤处理器,适于接收由所述数据收集客户端发送的运行数据,且根据预先存储的运行数据过滤策略过滤出需要报警的运行数据;以及报警处理器,其接收所述信号过滤处理器过滤出的需要报警的运行数据,且根据预先存储的报警策略进行报警。
可选地,本发明的适于监控多台服务器的监控系统还包括信号中转器。该信号中转器适于接收来自一个或者多个数据收集客户端所发送的数据,并将其转发给所述信号过滤处理器。
可选地,在本发明的适于监控多台服务器的监控系统中,每个报警策略包括唯一的报警策略ID以及报警条件,而且所述报警处理器包括:数据存储模块,适于根据所述信号过滤处理器所过滤出的数据来构造报警数据表,所述报警数据表包括多个数据节点,每个数据节点上链接有环形双向链表,环形双向链表包括多个链表节点,其中每个数据节点由需要报警的运行数据中的机器域名和报警策略ID来标识,而与每个数据节点相关联的环形双向链表的每个链表节点中存储有具有相同机器域名和相同报警策略ID的需要报警的运行数据,所述多个链表节点根据其上的需要报警的运行数据的时间戳值大小进行链接排列;以及报警模块,根据每个数据节点中的报警策略ID选择相应的报警策略,并根据所选择的报警策略来确定与数据节点相关联的环形双向链表中的需要报警的运行数据是否达到所选择的报警策略中的报警条件,当确定满足报警条件时进行报警。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210459086.5/2.html,转载请声明来源钻瓜专利网。