[发明专利]一种资源监控方法及系统在审
申请号: | 201410367633.6 | 申请日: | 2014-07-29 |
公开(公告)号: | CN104092575A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 王少锋;张云勇;刘明辉 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李丹;栗若木 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 资源 监控 方法 系统 | ||
技术领域
本发明涉及云计算技术,尤指一种基于云计算平台的资源监控方法及系统。
背景技术
计算机运行时,需要对资源的运行状况进行实时监控,比如CPU使用率、内存使用率等。现有监控中,需要在系统中植入代码,这样必然影响系统的性能。特别是在云计算平台中,涉及的应用、资源众多,部署环境要求高,往往涉及集群,系统运行情况复杂,如果不能对云计算平台进行准确、有效的监控,则难以对云计算平台的实际运行情况进行掌控及调度。
监控在云计算系统中扮演着重要的角色。通过监控能够及时发现云计算平台在运营过程中的资源使用情况,从而及时发现异常情况。
云计算平台监控的一般原理是,在各个分散的云计算节点上运行守护进程,该守护进程用于收集本云计算节点上的监控信息并发送到汇聚节点,汇聚节点对收集到的监控信息进行分析与存储并将分析结果以可视化或告警等方式通知给用户。对于云计算平台监控系统来说,关键是各个云计算节点的守护进程与收集的监控信息的处理方式。
当前,比较流行的监控系统有Ganglia,InteMon,ClusterProbe,HP OpenView,IBM Tivoli等。其中,Ganglia,InteMon,ClusterProbe是开源软件,HP OpenView,IBM Tivoli是商用软件。
其中,ClusterProbe是现有常用的监控系统。ClusterProbe是由香港大学设计与开发的一款开放环境的集群监控工具。ClusterProbe的设计初衷在于开发高灵活性与扩展性的大规模集群监控系统。ClusterProbe主要包括监控服务器、监控代理节点和节点代理三部分,即代理(agent)+服务器(server)的方式。其中,监控服务器,用于接收用户的请求以及将用户感兴趣的监控结果反馈给用户,监控服务器通过交互适配器和网络上其它节点交互信息,该适配器能够支持多种网络交互协议;监控代理节点用于管理该节点及其下属所有子节点,这些子节点包括不同类型的资源类型,并组成监控域;节点代理,以守护进程的方式运行在云平台中的每个节点上,用于从监控代理节点接收命令或者根据自身的设置进行本地监控信息的收集,节点代理与监控代理节点通过Java远程方法调用(RMI)进行通信。
ClusterProbe的最大优点就是提出了开放式节点守护进程的概念,并且通过Java RMI实现功能的增减。这样,使得各个节点上的守护进程更加轻量级,也降低了监控系统对集群本身造成的压力。但是,ClusterProbe也存在一些不足之处,比如:系统使用Java RMI来实现远程方法调用,实现较复杂,当监控代理节点过多时,容易造成系统结构复杂,存在出现问题不易排查的缺陷。
根据上面的分析可知,现有监控系统通用的架构是代理+服务器的方式。其中,Agent用于收集监控资源的状态信息,server利用这些状态信息。Agent与server之间采用,在拉模式中,发起者是server,它采用轮询的方式从agent“拉”信息。拉模式实现相对简单,但会消耗较多的资源,实时性也较差。因此,拉模式适用于周期性询问的场景,但是,如果轮询周期较长,会降低资源的消耗,但可能丢失状态信息;如果轮询周期较短,则对系统性能影响较大。
现有监控系统往往需要安装agent来收集数据,并将数据传输到server上,以实现监控。这种监控方式会降低被监控系统性能,且监控数据容量越大,效率越低;同时,由于各个被监控系统使用的数据格式不统一,导致agent植入代码困难,而且由于需要创建监控节点,增大了系统的使用复杂度。
发明内容
为了解决上述技术问题,本发明提供了一种资源监控方法及系统,无需在系统中植入代码,能够降低监控的复杂度,且减少对系统运行性能的影响。
为了达到本发明目的,本发明提供了一种资源监控方法,包括:收集云计算平台中各个节点产生的日志数据;
匹配收集到的日志数据和预先设置的异常事件策略,如果匹配成功,则产生异常事件;
监听异常事件并进行告警。
所述收集云计算平台中各个节点产生的日志数据包括:将日志系统产生的日志数据推送至监控容器。
所述匹配收集到的日志数据和预先设置的异常事件策略库之前,该方法还包括:对所述对收集到的日志数据进行过滤。
所述匹配采用Java中的Java事件处理机制实现。
利用所述Java中的事件处理机制中包括的监听功能实现所述监听异常事件并进行告警。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410367633.6/2.html,转载请声明来源钻瓜专利网。