[发明专利]硬件设备异常监控方法、服务器及计算机可读存储介质在审
申请号: | 201910967009.2 | 申请日: | 2019-10-11 |
公开(公告)号: | CN110851322A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 何明烨;龙凯 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 硬件 设备 异常 监控 方法 服务器 计算机 可读 存储 介质 | ||
本发明涉及一种硬件监控技术,揭露了一种硬件设备异常监控方法,该方法包括:通过SaltStack管理工具统一设置硬件设备需要监控的各项指标和对应的阈值;通过IPMI接口分别采用预设方式采集所述硬件设备的各项指标数据;获取各项指标所设置的阈值;比较所采集的各项指标数据与对应阈值,判断是否出现异常;当有指标出现异常时,按预设方式发出预警通知。本发明还提供一种服务器及计算机可读存储介质。本发明提供的硬件设备异常监控方法、服务器及计算机可读存储介质能够提高发现异常的及时性,以及处理异常的效率。
技术领域
本发明涉及硬件监控技术领域,尤其涉及一种硬件设备异常监控方法、服务器及计算机可读存储介质。
背景技术
随着网络技术的不断进步和信息化进程的加快,机房设备种类和数量越来越多,相应的运维工作也越来越重,如何又快又准确的发现硬件故障问题,成为运维工作中亟需解决的问题。目前,针对各种硬件设备的异常检测,主要方式是人工巡检或是等待机器出现异常后再发现问题、处理问题。上述方式不仅浪费人力,而且效率低下,存在一定的滞后性。若发现问题后运维人员没有可靠的排除故障的方法,完全依赖于联系售后人员来解决问题,不能及时对发现的问题进行修复处理,也会影响硬件设备的工作进度,造成较大损失。另外,随着网络中的设备数量越来越多,运维人员已经不可能走进机房管理每台机器,如何有效进行远程控制管理也就愈加重要。
发明内容
有鉴于此,本发明提出一种硬件设备异常监控方法、服务器及计算机可读存储介质,以解决如何及时发现和处理硬件设备异常的问题。
首先,为实现上述目的,本发明提出一种硬件设备异常监控方法,该方法包括步骤:
通过SaltStack管理工具统一设置硬件设备需要监控的各项指标和对应的阈值;
通过智能平台管理接口IPMI分别采用预设方式采集所述硬件设备的各项指标数据;
获取各项指标所设置的阈值;
比较所采集的各项指标数据与对应阈值,判断是否出现异常;及
当有指标出现异常时,按预设方式发出预警通知。
可选地,该方法还包括步骤:
记录对所述异常的处理反馈信息;
保存所采集的所述各项指标数据和所述处理反馈信息,以便进行回溯操作。
可选地,该方法还包括步骤:
根据历史记录的所述处理反馈信息,筛选出所述异常的优选处理方案;
向用户提示所述优选处理方案,以便用户参照处理所述异常。
可选地,在所述通过SaltStack管理工具统一设置硬件设备需要监控的各项指标和对应的阈值的步骤中:
针对需要监控的多个所述硬件设备以及每个所述硬件设备需要监控的各项指标配置拓扑结构,并将针对各项指标所设置的阈值保存在所述拓扑结构中对应硬件设备和指标所在的节点位置。
可选地,在所述通过智能平台管理接口分别采用预设方式采集所述硬件设备的各项指标数据的步骤中:
遍历所述拓扑结构中的每个节点,向每个所述硬件设备发送相应的智能平台管理接口命令,以进行对应指标的数据采集。
可选地,在所述获取各项指标所设置的阈值的步骤中:
若所述指标为数值数据指标,则从所述SaltStack管理工具的统一设置中获取所述指标对应的报警阈值;若所述指标为非数值数据指标,则在监测到故障时,触发所述发出预警通知的步骤。
可选地,在所述按预设方式发出预警通知的步骤中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910967009.2/2.html,转载请声明来源钻瓜专利网。