[发明专利]大规模分布式文件系统数据修复方法及设备有效

专利信息
申请号: 201710198342.2 申请日: 2017-03-29
公开(公告)号: CN107402841B 公开(公告)日: 2021-01-29
发明(设计)人: 周泰;石超;刘善阳 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F11/14 分类号: G06F11/14;G06F16/182
代理公司: 上海百一领御专利代理事务所(普通合伙) 31243 代理人: 陈贞健;王路丰
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 大规模 分布式 文件系统 数据 修复 方法 设备
【说明书】:

发明的目的是提供一种大规模分布式文件系统数据修复方法及设备,根据每个数据块管理模块视角的损坏的数据块及其最长可修复长度,和所述文件系统命名空间管理模块视角的损坏的数据块能够准确地确定实际损坏的数据块及其最长可修复长度,进而精确确定每个损坏文件中实际损坏的数据块及其最长可修复长度,在供电故障导致的分布式文件系统集群掉电重启进行数据修复的过程中,根据每个损坏文件中实际损坏的数据块及其最长可修复长度,对该损坏文件实现快速和有效数据修复,可以有效增大RPO、缩短RTO,即提高数据修复能力,减少数据修复耗时。

技术领域

本发明涉及计算机领域,尤其涉及一种大规模分布式文件系统数据修复方法及设备。

背景技术

近年来,云计算技术日益普及,云计算产品线日益丰富,带来了巨大的社会价值。云存储产品是云计算产品线中的重要组成部分。各种云存储产品通常采用大规模分布式文件系统作为底层支撑系统来存储用户的数据。

典型分布式文件系统主要包含三个模块,以三种角色部署在由普通商用服务器构成的集群上。分布式文件系统的三个模块是指:

1.Client:客户端库,为用户提供访问分布式文件系统的各种接口;

2.Chunkserver:数据块(Chunk)管理模块,管理分布式文件系统的数据块及相关元数据,执行Master指派的任务;

3.Master:文件系统命名空间管理模块,管理分布式文件系统的元数据,如文件名到数据块元数据的映射等。

典型分布式文件系统的架构如图1所示,图1中,File name表示文件名,chunkindex表示数据块编号,chunk hadle表示数据块的唯一ID,chunk locations表示数据块位置,instructions to chunkserver表示向chunkserver发出的指令,chunkserver state表示向master反馈的指令执行状态,byte range表示用户一次写入的字节范围,是用户视角的内容,不涉及底层数据块的概念。数据块存储时,物理上表现为一个文件;逻辑上会按照固定大小切片计算校验和。

成本、性能等指标是衡量大规模分布式文件系统设计和实现优劣的重要指标,也是决定其所支撑公有云产品市场竞争力的重要因素。

为了降低成本,大规模分布式文件系统通常部署在由普通商用服务器构成的集群上。普通商用服务器通常不配备UPS、RAID卡等高端设备,普遍采用SATA磁盘作为持久存储设备。也就是说,普通商用服务器没有配备后备电源/电池等保护设备,机器断电后易失性存储器中存储的内容会立即丢失。

为了提高系统性能,大规模分布式文件系统在其文件读写路径上采用了多项优化性能的技术,简要介绍以下两种:

1.改进分布式文件系统层写协议。

在分布式文件系统中关于文件的信息分为两部分:元数据信息和数据信息(数据块)。其中元数据信息存储在Master中,数据信息存储在Chunkserver中。为了保证可靠写入,系统首先将数据信息写入Chunkserver中,然后将相关元数据信息写入Master中,并返回用户写入成功。为了减少与Master的交互,系统会向Chunkserver中写入若干次数据信息,并向用户返回写入成功,然后再将元数据信息写入Master。写入一组数据信息后只写入一次元数据信息可以有效降低写延迟,降低Master负载。

2.利用Linux文件系统提供的能力优化写操作性能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710198342.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top