[发明专利]分布式存储系统硬盘挂住故障检测、处理方法及装置在审
申请号: | 201610212740.0 | 申请日: | 2016-04-07 |
公开(公告)号: | CN107273231A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 王勇;赵树起;朱家稷;董乘宇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙)11363 | 代理人: | 逯长明,许伟群 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 存储系统 硬盘 故障 检测 处理 方法 装置 | ||
1.一种分布式存储系统硬盘挂住故障检测方法,其特征在于,包括:
检测目标硬盘对应的各个访问请求的执行时间;
判断是否存在执行时间大于对应的预设阈值的时滞请求;
如果存在所述时滞请求,则确定所述目标硬盘出现挂住故障。
2.根据权利要求1所述的检测方法,其特征在于,还包括:
创建所述目标硬盘对应的IO线程组;
通过所述IO线程组读取并处理所述目标硬盘对应的各个访问请求,以完成对所述目标硬盘的读写操作。
3.根据权利要求1或2所述的检测方法,其特征在于,检测目标硬盘对应的各个访问请求的执行时间,包括:
检测目标硬盘的输入队列中处于队头位置的访问请求的执行时间。
4.一种分布式存储系统硬盘挂住故障处理方法,其特征在于,包括:
当目标硬盘出现挂住故障时,将所述目标硬盘的状态标记为挂住故障状态;
清理所述目标硬盘对应的被挂住管理进程所占用的系统资源,以便启动新的用于管理所述目标硬盘的管理进程。
5.根据权利要求4所述的故障处理方法,其特征在于,清理所述目标硬盘对应的被挂住管理进程所占用的系统资源,包括:
申请新内存,并通过所述新内存执行下述两步操作,以清除所述被挂住管理进程占用的内存资源;
查找得到所述被挂住进程占用的全部内存段;
分别解除每个内存段对应的内存映射。
6.根据权利要求4或5所述的故障处理方法,在清理所述目标硬盘对应的被挂住管理进程所占用的系统资源之前,还包括:
弹出所述目标硬盘的输入队列中缓存的各个访问请求,并返回所述目标硬盘的故障信息。
7.根据权利要求4或5所述的故障处理方法,其特征在于,还包括:
在每次启动所述目标硬盘的管理进程后,确定所述目标硬盘的状态;
如果所述目标硬盘的状态为挂住故障状态,则禁止对所述目标硬盘的访问。
8.根据权利要求4或5所述的故障处理方法,其特征在于,还包括:
将所述目标硬盘的挂住故障状态保存至正常的硬盘。
9.一种分布式存储系统硬盘挂住故障检测装置,其特征在于,包括:
检测单元,用于检测目标硬盘对应的各个访问请求的执行时间;
比较单元,用于判断是否存在执行时间大于对应的预设阈值的时滞请求,如果存在所述时滞请求,则确定所述目标硬盘出现挂住故障。
10.根据权利要求9所述的故障检测装置,其特征在于,还包括:
进程管理单元,用于创建所述目标硬盘对应的IO线程组,并通过所述IO线程组读取并处理所述目标硬盘对应的各个访问请求,以完成对所述目标硬盘的读写操作。
11.根据权利要求9或10所述的故障检测装置,其特征在于,为实现检测目标硬盘对应的各个访问请求的执行时间,所述检测单元具体被配置为:
检测目标硬盘的输入队列中处于队头位置的访问请求的执行时间。
12.一种分布式存储系统硬盘挂住故障处理装置,其特征在于,包括:
状态管理单元,用于当目标硬盘出现挂住故障时,将所述目标硬盘的状态标记为挂住故障状态;
资源清理单元,用于清理所述目标硬盘对应的被挂住管理进程所占用的系统资源,以便启动新的用于管理所述目标硬盘的管理进程。
13.根据权利要求12所述的故障处理装置,其特征在于,为实现清理所述目标硬盘中被挂住管理进程所占用的系统资源,所述资源清理单元具体被配置为,
申请新内存,并通过所述新内存执行下述两步操作,以清除所述被挂住管理进程占用的内存资源:查找得到所述被挂住进程占用的全部内存段,以及分别解除每个内存段对应的内存映射。
14.根据权利要求12或13所述的故障处理装置,其特征在于,还包括:
请求清理单元,用于弹出所述目标硬盘的输入队列中缓存的各个访问请求,并返回所述目标硬盘的故障信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610212740.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:强制重置微控制器的方法
- 下一篇:一种企业信息化系统自愈调度方法