[发明专利]一种存储集群失效的恢复方法、装置和存储控制器在审
| 申请号: | 201811361288.X | 申请日: | 2018-11-15 |
| 公开(公告)号: | CN109508250A | 公开(公告)日: | 2019-03-22 |
| 发明(设计)人: | 王孝鹏 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
| 主分类号: | G06F11/07 | 分类号: | G06F11/07 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 集群 存储控制器 存储 软件系统 重启 恢复 恢复事件 存储系统 恢复能力 可维护性 状态恢复 自动处理 自动启动 自动重启 主进程 发送 申请 | ||
本申请公开了一种存储集群失效的恢复方法、装置和存储控制器,该恢复方法包括:当存储集群发生失效时,重启存储控制器的软件系统,以使软件系统的主进程发送集群恢复事件;当软件系统重启后,根据集群恢复事件,启动集群恢复流程;当集群恢复流程完成后,重启软件系统,以使存储控制器重新加入存储集群。在该方法中,当存储集群发生失效时,每个存储控制器能够自动重启软件系统并自动启动集群恢复流程,而集群恢复流程能够将存储控制器的状态恢复至存储集群失效前的状态,以使再次重启软件系统时,存储控制器能够加入存储系统并进行I/O处理,实现了自动处理存储集群失效的故障,提高了存储集群的恢复能力,并提高存储集群的稳定性和可维护性。
技术领域
本申请涉及存储技术领域,尤其涉及一种存储集群失效的恢复方法、装置和存储控制器。
背景技术
随着存储技术的发展,越来越多的存储系统通过采用存储集群提高该存储系统的存储性能和稳定性。其中,存储集群可以由多个存储控制器组成。
在存储集群中,当某个存储控制器发生故障时,其它存储控制器能够代替该存储控制器进行工作,从而保证存储集群能够正常进行工作,以使该存储的输入/输出(Input/Output,I/O)不发生中断。而且,当发生故障的存储控制器被修复后,再加入存储集群时,存储集群能够自动对该存储控制器进行恢复,使该存储控制器的状态与该存储集群中的其它存储控制器的状态保持一致,以便于恢复正常工作。
然而,由于存储集群中每个存储控制器中的软件系统都是相同的,而且在存储集群的运行过程中每个存储控制器的状态也是一致的,因而,当存储集群运行到某一状态或处理某个事件时,如果所有存储控制器的软件系统均触发了同一个软件错误(Bug),将导致所有存储控制器同时发生故障,使得所有存储控制器都无法工作,进一步使得存储集群因I/O中断而发生失效。此时,由于现有存储集群自身的局限性,无法自动处理存储集群失效的故障,从而降低了存储集群的稳定性。
发明内容
为了解决现有技术中存在的以上技术问题,本申请提供一种存储集群失效的恢复方法、装置和存储控制器,能够自动处理存储集群失效的故障,从而提高了存储集群的稳定性。
为了实现上述目的,本申请提供的技术方案如下:
本申请提供一种存储集群失效的恢复方法,所述存储集群包括至少一个存储控制器;
该方法包括:
当所述存储集群发生失效时,重启所述存储控制器的软件系统,以使所述软件系统的主进程发送集群恢复事件;
当所述软件系统重启后,根据所述集群恢复事件,启动集群恢复流程;其中,所述集群恢复流程用于将所述存储控制器的状态恢复至存储集群失效前的状态;
当所述集群恢复流程完成后,重启所述软件系统,以使所述存储控制器重新加入所述存储集群。
可选的,所述启动集群恢复流程,具体包括:
清除所述软件系统的非重要数据;其中,所述非重要数据是指除了所述存储集群恢复所需数据以外的数据;
同步所述存储控制器的状态,以使所有所述存储控制器处于同一状态。
可选的,所述当所述存储集群发生失效时,重启所述存储控制器的软件系统,以使所述软件系统的主进程发送集群恢复事件之前,还包括:
当所述存储控制器的软件系统的主进程非正常退出时,判断所述存储集群是否发生失效。
可选的,所述判断所述存储集群是否发生失效,具体包括:
判断所有所述的存储控制器的状态是否一致;若是,则确定所述存储集群没有发生失效;若否,则确定所述存储集群发生失效。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811361288.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:崩溃处理方法、装置及电子设备
- 下一篇:数据存储方法、系统、设备和介质





