[发明专利]一种基于ICFS系统的OSD故障定位方法及系统在审
申请号: | 201810325885.0 | 申请日: | 2018-04-12 |
公开(公告)号: | CN108519927A | 公开(公告)日: | 2018-09-11 |
发明(设计)人: | 徐晓阳 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 故障判定 定位方法及系统 分类 判定 故障处理效率 发生故障 故障定位 故障提供 数据冗余 预先设置 集群 申请 | ||
本发明公开了一种基于ICFS系统的OSD故障定位方法及系统,包括预先对ICFS系统中的OSD的故障进行分类及对故障对应的故障判定方式进行分类;获取ICFS系统的故障判定信息,故障判定信息包括ICFS系统中各个OSD的OSD信息和/或ICFS系统的数据冗余规则;根据故障判定信息并结合预先设置好的故障判定方式及故障的分类判定是否存在OSD发生故障。可见,本申请预先对OSD的故障和故障判定方式进行分类,并作为后续OSD故障定位的判定依据,以便后续结合ICFS系统的故障判定信息来判定OSD是否存在故障,为可能发生的故障提供了定位方向,缩短了故障定位时间,提高了故障处理效率,提高了集群的性能。
技术领域
本发明涉及分布式系统技术领域,特别是涉及一种基于ICFS系统的OSD故障定位方法及系统。
背景技术
目前对于海量存储产品,用户可以自行定义数据的冗余规则(例如副本或者纠删),并通过CRUSH算法指定数据的物理存储位置,完成故障域的分离。但是在存储系统例如ICFS(Inspur Cluster File System,分布式文件系统)系统中,一个存储节点支持12到54个磁盘不等,使得其OSD的故障率也大大高于其他系统。根据ICFS系统提供的数据冗余规则,允许存储节点出现磁盘故障,但必须保证集群可以正常使用且数据不丢失,但是目前ICFS系统中OSD故障处理都需要开发人员进行现场定位,定位时间长,降低了集群的性能。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种基于ICFS系统的OSD故障定位方法及系统,为可能发生的故障提供了定位方向,缩短了故障定位时间,提高了故障处理效率,提高了集群的性能。
为解决上述技术问题,本发明提供了一种基于ICFS系统的OSD故障定位方法,包括:
预先对ICFS系统中的OSD的故障进行分类及对所述故障对应的故障判定方式进行分类;
获取所述ICFS系统的故障判定信息,所述故障判定信息包括所述ICFS系统中各个OSD的OSD信息和/或所述ICFS系统的数据冗余规则;
根据所述故障判定信息并结合预先设置好的故障判定方式及故障的分类判定是否存在OSD发生故障。
优选地,所述OSD的故障分类包括OSD Down和/或OSD的容量达到极限范围和/或OSD震荡和/或OSD慢盘。
优选地,当所述OSD的故障分类包括OSD Down时,所述OSD Down包括故障域内的部分OSD Down、不同故障域内的共同持有一些对象的数据的OSD同时down和OSD Down掉且不在osd tree中。
优选地,所述OSD Down对应的故障判定方式为:
输入icfs-s指令后,所述ICFS系统中的各个OSD的OSD信息中,存在OSD的状态信息为down;
所述OSD的容量达到极限范围对应的故障判定方式为:
输入icfs-s指令后,存在near full告警信息;
所述OSD震荡对应的故障判定方式为:
所述ICFS系统中,存在OSD的状态在第一预设时间内多次交替出现up和down;
所述OSD慢盘对应的故障判定方式为:
所述ICFS系统的状态出现blocked。
优选地,该方法还包括:
预先针对所述OSD的不同类别的故障制定故障解决策略;
在判定所述ICFS系统存在故障后,该方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810325885.0/2.html,转载请声明来源钻瓜专利网。