[发明专利]一种云中心智能告警处理系统及方法在审
申请号: | 202110036592.2 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112866020A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 杨继伟;魏金雷;于颜华 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中心 智能 告警 处理 系统 方法 | ||
本发明公开了一种云中心智能告警处理系统及方法,属于IT运维技术领域。本发明的云中心智能告警处理系统包括资源管理、指标定义、值班管理、告警规则、告警视图模板、告警和告警视图,资源管理来管理资源,资源包括虚机、物理机、交换机、存储设备、虚拟设备、中间件及应用软件;指标定义来定义指标,指标为被数据采集的项目,包括CPU、内存、网络进出流量;值班管理用于安排每日的值班人员;当出现异常时,根据告警规则实时触发告警;根据告警视图模板生成告警视图,其中告警视图模板与告警规则一一对应。该发明的云中心智能告警处理系统有助于快速排查问题,找出故障根因,提高运维效率,具有很好的推广应用价值。
技术领域
本发明涉及IT运维技术领域,具体提供一种云中心智能告警处理系统及方法。
背景技术
在云计算飞速发展的今天,各地云中心也遍地开花。云中心配备的云管系统在保证云中心各项业务正常开展的同时也要配备一套运维管理系统,用来保障系统长期稳定的运行。运维管理系统一般会对云中心的各种设备进行运维管理,当系统出现异常时如何能够及时发现以及解决异常成为了运维管理系统的难题。
目前云中心的运维管理系统,对运维人员的依赖性较大,对资源的监控数据分别采集,相互之间没有联系。当发生告警或者出现故障时,需要人工通过各种查找来排查问题,费时费力。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种可以将云中心的资源关联起来,也将告警相互关联起来,有助于快速排查问题,找出故障根因,提高运维效率的云中心智能告警处理系统。
本发明进一步的技术任务是提供一种云中心智能告警处理方法。
为实现上述目的,本发明提供了如下技术方案:
一种云中心智能告警处理系统,包括资源管理、指标定义、值班管理、告警规则、告警视图模板、告警和告警视图,资源管理来管理资源,资源包括虚机、物理机、交换机、存储设备、虚拟设备、中间件及应用软件;指标定义来定义指标,指标为被数据采集的项目,包括CPU、内存、网络进出流量;值班管理用于安排每日的值班人员;当出现异常时,根据告警规则实时触发告警;根据告警视图模板生成告警视图,其中告警视图模板与告警规则一一对应;指标不在阀值范围时触发告警,根据告警信息关联的告警规则生成告警视图。
作为优选,所述资源管理的资源的属性包括编码、名称、资源类型和关联资源。这些资源首先要被人工录入到系统中或者可以被自动发现而自动录入到系统中。每种资源可以有自己的个性化属性,资源的属性被持久化到数据库中,每种资源可以单独建表维护。资源的关联资源是指资源所从属的资源或者有连接关系的资源,比如虚机要位于一台物理机上,则虚机所属的一种资源为物理机,则虚机的一种关联资源为物理机。再比如物理机会通过交换机进行网络连接,则物理机的一种关联资源为交换机。一种资源可以对应多种关联资源,配置关联资源只需配置关联的资源类型即可。
作为优选,所述指标定义的指标的属性包括编码、名称、所属资源、单位。指标定义的编码必须与数据采集层的指标编码一致。
作为优选,所述告警规则包括规则名称、规则使用的指标、指标的阈值、当指标不在阈值范围内时的处理建议。告警规则可以定义告警级别:严重、主要、次要、一般、警告。每种级别的告警都要设置告警阈值。
作为优选,所述告警视图模板包含关联指标、指标显示形式、时间范围和值班。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110036592.2/2.html,转载请声明来源钻瓜专利网。