[发明专利]大规模分布式文件系统数据修复方法及设备有效
申请号: | 201710198342.2 | 申请日: | 2017-03-29 |
公开(公告)号: | CN107402841B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 周泰;石超;刘善阳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F16/182 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 陈贞健;王路丰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大规模 分布式 文件系统 数据 修复 方法 设备 | ||
1.一种大规模分布式文件系统数据修复方法,其中,该方法包括:
根据数据块管理模块视角的损坏的数据块及其最长可修复长度,和文件系统命名空间管理模块视角的损坏的数据块,确定损坏文件中实际损坏的数据块及其最长可修复长度;最大可修复长度为:数据块出错后,其数据可以修复的最大长度;
根据损坏文件中实际损坏的数据块及其最长可修复长度,对该损坏文件进行数据修复;
其中,确定损坏文件中实际损坏的数据块及其最长可修复长度,包括:
根据所述文件系统命名空间管理模块视角的损坏的数据块,过滤数据块管理模块视角的损坏的数据块中实际未损坏的数据块,并将未过滤掉的实际上损坏的数据块按照所在文件聚合,得到损坏文件中实际损坏的数据块及其最长可修复长度。
2.根据权利要求1所述的方法,其中,所述数据块管理模块视角的损坏的数据块及其最长可修复长度的获取,包括:
根据数据块管理模块上预设时间段内的操作日志,获取数据块管理模块该时间段内更新过的数据块;
校验更新过的数据块内的各个数据片,如果某个数据块内至少有一个数据片校验不通过,则将该数据片所在的数据块确定为损坏的数据块,确定损坏的数据块的最长可恢复长度,并在对应的数据块管理模块上将该数据块标记为损坏的数据块。
3.根据权利要求2所述的方法,其中,校验更新过的数据块内的各个数据片,如果某个数据块内至少有一个数据片校验不通过,则将该数据片所在的数据块确定为损坏的数据块,确定损坏的数据块的最长可恢复长度,包括:
从数据块管理模块获取更新过的数据块的长度;
根据所述长度及数据片的规定长度,确定满足规定长度的数据片;
对满足规定长度的数据片计算新的校验和,并将所述新的校验和与之前存储该数据片的校验和作比较,如果不匹配,标记该损坏的数据片所在的数据块为损坏的数据块,该损坏的数据块的最大可修复长度=至第一个不匹配的数据片之前的位置。
4.根据权利要求3所述的方法,其中,该损坏的数据块的最大可修复长度=至第一个不匹配的数据片之前的位置的步骤之后还包括:
扫描该损坏的数据块对应的日志,如果存在一条日志,其记录的数据偏移量在该数据块的所述第一个不匹配的数据片的规定长度的区间之内,则读取从所述第一个不匹配的数据片的开始位置至所述偏移量结束位置的对应的数据,计算校验和,并与日志中记录的校验和作比较,如果一致,则更新该损坏的数据块的最大可修复长度=偏移量处的位置。
5.根据权利要求2所述的方法,其中,所述预设时间段内的操作日志的获取,包括:
在日志目录中查找是否有所述预设时间段内的快照,
若有,将所述快照转化为对应的日志,并从日志目录中读取在所述预设时间段内且在所述快照之后的日志,并将所述快照转化得到的日志和所述快照之后的日志作为所述预设时间段内的操作日志;
若无,在日志目录中读取所述预设时间段内的操作日志。
6.根据权利要求2所述的方法,其中,所述文件系统命名空间管理模块视角的损坏的数据块的获取,包括:
根据所述数据块管理模块上标记为损坏的数据块,获取所述文件系统命名空间管理模块视角的损坏的数据块。
7.根据权利要求1所述的方法,其中,根据损坏文件中实际损坏的数据块及其最长可修复长度,对该损坏文件进行数据修复,包括:
获取损坏文件的全集群视角的数据块元信息,其中,所述全集群视角的数据块元信息由文件系统命名空间管理模块视角的损坏文件数据块的存储位置,与该损坏文件中实际损坏的数据块的存储位置和最长可修复长度合并得到;
根据损坏文件的全集群视角的数据块元信息,对该损坏文件进行数据修复。
8.根据权利要求7所述的方法,其中,根据损坏文件的全集群视角的数据块元信息,对该损坏文件进行数据修复,包括:
根据损坏文件的文件类型和全集群视角的数据块元信息,计算损坏文件的最长可修复长度;
根据损坏文件的最长可修复长度,对该损坏文件进行数据修复。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710198342.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置