[发明专利]一种服务器健康度评估方法有效
申请号: | 201611139559.8 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106776214B | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 李冰;林坚宏 | 申请(专利权)人: | 广州市申迪计算机系统有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服务器 健康 评估 方法 | ||
本发明提供了一种服务器健康度评估方法,包括步骤:S1:获取服务器的网元指标;S2:通过网管的指标阈值监控信息获取每一网元指标的告警等级以及每一告警等级的指标阈值,指标阈值包括指标阈值上限或/和指标阈值下限;S3:实时获取每一网元指标性能值;当网元指标性能值未超出指标阈值上限或未低于指标阈值下限时,根据每一告警等级、每一告警等级的指标阈值以及每一网元指标性能值计算每一网元指标的健康度损减分数;S4:计算服务器的健康度。本发明提供的服务器健康度评估方法,能够更科学,更真实有效的反映服务器的健康度,并且,通过该方法得出的评估结果,能够帮助网管人员快速找出更可能出现告警或者告警严重的服务器。
技术领域
本发明涉及计算机领域,尤其涉及一种服务器健康度评估方法。
背景技术
不同的服务器工作内容大不相同,很多服务器经常连续不停运转,加上负载不均衡等原因,使得服务器故障层出不穷。较早的服务器监控方法非常简单:针对每台服务器分别下达指令以采集相关指标来判断其运行状况。然而,随着服务器规模的急剧扩大,针对单个服务器通过指令判断故障的方法已经无法满足需求。
为了能有效监控大量服务器,市场上出现了各种服务器性能监控软件。这些软件能够对各个指标进行有效监控,如cpu,内存,磁盘,网络流量等。通过了解各个监控指标的性能以及状态信息,可以快速了解服务器各个部分的运行情况。如果事先为各个指标设立监控指标阈值,当性能值超过指标阈值即可触发告警,并及时发送告警信息通知网管人员维修。这也是目前服务器监控中最普遍的做法。然而,对服务器整体性能做出评估的软件却少之甚少。主要原因在于服务器各有分工,不同的工作任务使得各个指标对不同服务器的重要性也各不相同。对一些服务器而言cpu是一个重要指标,但是对其他服务器而言cpu可能不及内存更重要,因此,在对服务器做整体评估时,不能同一地对待各个指标对服务器总的影响力。这也是很难对整个服务器性能评估的主要原因之一。尽管如此,对服务器整体的性能评估依然很重要,因为只有这样我们才能知道这台服务器是否健康。例如,一些服务器虽未触发告警,但可能各项指标均接近指标阈值,如果不能及时检测出来,很有可能出现服务器运行不稳定,甚至出现系统崩溃的情况。因此,及时了解服务器各项指标的运行情况和服务器整体健康状况是非常重要的。
目前的服务器健康度评估方法中,对各个组件的健康度评估比较武断,服务器健康度量化结果不够细分,且健康度分段过程中指标阈值设定同一化,难以将不同业务下的指标进行有效区分,例如:很多文献直接按照一特定指标阈值将其分为健康、不健康、亚健康。一方面,统一地将组件分为健康、不健康、亚健康太过笼统,很难进一步将评估结果细分。另一方面,这里面的指标阈值设定对少量服务器而言还可操作,但是,面对大量服务器,如何设定合适的指标阈值就是一个难题了。相当多的做法是为各个指标,如cpu占用率,按照经验设定指标阈值,超出90%为不健康,超出80%亚健康,低于80%为健康。这么做虽然操作简单,但是,不同的服务器业务不同,对指标的要求也各不相同,设定同一的指标阈值显然会使结果出现较大误差。当然,有的文献结合告警事件来确定网元指标在触发告警后产生的健康度下降程度,但是也只是将超出指标阈值而触发告警的情况考虑进去,却没有考虑未触发告警的情况下网元指标的健康度问题。即,服务器健康度衡量中普遍认为未触发告警时的服务器是健康的,从而将未触发告警的情况忽略掉。事实上,未触发告警时的健康度问题更为重要。这是因为,大多服务器并未触发告警,如果均不考虑的话,很难将其中接近告警范围却并未触发告警的服务器识别出来。
大多数文献在利用网元指标(或组件)加权求取系统的整体健康度时,要么采用专家经验定权,要么利用图的广度优先遍历算法定权,但是,这样得出的健康度结果很难直接和告警分析结合起来。无论上述哪种权重判定方法,且不管权重设定是否准确,由于未结合告警分析的目标,得出的评估结果很难直接用来辅助告警分析。服务器健康度的评估结果需要直接来判定服务器在告警分析中的严重程度,上述权重均难以达到此种目的。
发明内容
针对现有技术的缺点,本发明的目的是提供一种服务器健康度评估方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市申迪计算机系统有限公司,未经广州市申迪计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611139559.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能终端的工厂测试方法、系统及工厂测试设备
- 下一篇:一种计算机硬件监控装置