[发明专利]一种多控制器系统的故障监控系统有效
申请号: | 201710096305.0 | 申请日: | 2017-02-22 |
公开(公告)号: | CN106802854B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 苑忠科 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/32;G06F9/48 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 控制器 系统 故障 监控 | ||
本发明公开了一种多控制器系统的故障监控系统,在多控制器系统中的各控制器中设置故障监控装置,所述故障监控装置包括:策略设置模块,硬件监控模块,系统监控模块,存储功能监控模块,共享在线统计模块,监控系统状态交互模块,告警管理模块,故障迁移模块;能够高效监控多控制器系统,及时发现故障信息,并准确做出相应处理,保证多控制器存储业务的无缝切换以及数据安全,提高多控制器系统的使用率。
技术领域
本发明涉及服务器技术领域,特别涉及一种多控制器系统的故障监控系统。
背景技术
随着存储技术的发展,存储的数据量不断增大,从TB到PB再到EB数量级;存储的性能也不断提高,从STAT到SAS再到PCIE连接的SSD存储介质。在多控系统中,对用户数据安全性的要求也日渐严格,7X24小时不间断工作,若实现多控制器存储业务的无缝切换,需要及时处理多控系统中存储空间不足和故障磁盘替换后通知用户及时添加空间和替换磁盘,以及其他存储软件定义的故障发生时的故障。因此,如何高效监控多控系统,及时发现这些故障信息,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种多控制器系统的故障监控系统,能够高效监控多控制器系统,及时发现故障信息,并准确做出相应处理,保证多控制器存储业务的无缝切换以及数据安全,提高多控制器系统的使用率。
为解决上述技术问题,本发明提供一种多控制器系统的故障监控系统,在多控制器系统中的各控制器中设置故障监控装置,其中,所述故障监控装置包括:
策略设置模块,用于提供用户设置各监控功能的告警阈值以及对应故障处理方式的接口;
硬件监控模块,用于监控控制器、扩展柜、外接设备的硬件状态和故障;
系统监控模块,用于监控操作系统的状态和故障;
存储功能监控模块,用于监控各存储功能模块的状态和故障;
共享在线统计模块,用于监控共享业务的在线状态;
监控系统状态交互模块,用于设置监控系统状态副本,接收所述硬件监控模块、所述系统监控模块、所述存储功能监控模块以及所述共享在线统计模块的监控数据并通过管理链路与其它控制器的监控系统状态副本进行数据交互;
告警管理模块,用于根据所述硬件监控模块、所述系统监控模块、所述存储功能监控模块以及所述共享在线统计模块得到的故障数据发送告警信息;
故障迁移模块,用于根据所述监控数据执行对应的迁移任务;其中,所述迁移任务包括控制器间的负载迁移任务和故障迁移任务。
可选的,所述硬件监控模块包括:
温度监控单元,用于对控制器主板、cpu、背板进行温度监控;
电气监控单元,用于对控制器主板的电压和电流进行监控,并对控制器的电源进行监控;
扩展柜监控单元,用于对扩展柜进行监控,当监控到扩展柜离线或扩展柜发生错误时,向所述告警管理模块发送告警数据。
可选的,所述系统监控模块包括:
使用率监控单元,用于对cpu以及内存的使用率进行监控;
异常程序监控单元,用于对系统panic程序和oops程序进行监控;
分区状态监控单元,用于对各系统分区的使用率和系统分区文件系统错误进行监控。
可选的,所述存储功能监控模块包括:
存储功能监控单元,用于对磁盘添加、移除、故障状态进行监控,并监控RAID状态,在降级时进行热备替换并向所述告警管理模块发送告警数据,且在RAID状态离线时向所述告警管理模块发送告警数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710096305.0/2.html,转载请声明来源钻瓜专利网。