[发明专利]I/O优化的分布式存储数据修复方法有效

专利信息
申请号: 201710164230.5 申请日: 2017-03-17
公开(公告)号: CN106911793B 公开(公告)日: 2020-06-16
发明(设计)人: 骆源;何奇芫;应臣浩 申请(专利权)人: 上海交通大学
主分类号: H04L29/08 分类号: H04L29/08;G06F11/14
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 郭国中
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 优化 分布式 存储 数据 修复 方法
【说明书】:

发明提出了一种I/O优化的分布式存储数据修复方法:包括如下任一个或任多个步骤:‑针对故障节点的RBT帮助数据块,可以利用修复故障节点时下载的数据计算得到数据块的内容,不需要读取或下载新的数据;‑对于非RBT帮助数据块,通过计算数据块的公共修复集合,减小从磁盘读取的数据。本发明实现了在节点故障和数据块损坏组合模式下数据修复时的I/O优化。

技术领域

本发明属于存储编码技术领域,具体是一种I/O优化的分布式存储数据修复方法,该方法实现分布式存储中数据修复时的I/O优化。

背景技术

如今,在大型分布式存储中,存储数据的总量以指数级的方式增长着。存储系统会面临许多数据节点临时失效或永久失效的问题,为了保证系统的可靠性,大多数存储系统会选择给数据提供备份。例如Google文件系统就采用了3倍备份的方法。备份得到应用的原因是实现方便,易操作,数据恢复简单并且可靠。然而,由于数据量的极速增长,备份的方法给存储开销带来了极大的负担。

纠删码为存储系统提供了另一个选择,与备份相比,它能在低冗余的前提下,提供较好的数据可靠性。尤其是Reed-Solomon(RS)码在分布式存储中得到了大量的应用。据报道,Facebook通过采用RS码替代备份的方法,节约了PB级字节的存储开销。

在RS码中,文件被编码后存储到多个节点上,数据节点的个数为k,校验节点的个数为r。(k+r)个节点共同构成了分布式存储系统,(k+r)个节点中的任意k个节点都能用来恢复得到原始文件,存储系统的容错能力为r个节点。

RS码在修复节点故障时,是用k个节点先得到所有原始文件,然后再对节点损坏的数据进行修复。这个过程的传输带宽是k个节点上存储的数据总量。分布式存储中节点故障的情形大多为单节点故障,而这种以恢复原始文件来修复单个故障节点的方法,会对系统资源造成极大的负担。

再生码(Regenerating codes)很好的解决了节点修复时的带宽问题。再生码在节点数据下载前会在节点内部进行运算,下载的数据为运算后的结果。这样,再生码通过从d(>k)个节点分别下载一小部分数据来实现节点修复。再生码适用于带宽资源紧缺的分布式存储系统。

再生码能够优化节点修复过程中的带宽,但是再生码在节点内部的运算会首先读取整个节点上的数据,节点修复过程中的I/O是d个节点上的所有数据。这个值高于RS码的k个节点数据,对系统的I/O资源带来了较大的负担。随着存储系统计算能力的增强,影响节点修复性能的主导因素成为了I/O,即从磁盘上读取的数据量。I/O已经成为了分布式存储的重要资源,更是许多分布式系统的性能瓶颈。Reconstruct-by-Transfer(RBT)码实现了节点修复过程中的I/O优化。RBT码的结构基于再生码,其特点是存储数据为节点参与修复时的计算数据,而不直接存储编码数据。

相比于节点故障,更为常见的故障情形是数据块损坏。数据块损坏是节点上的某一块数据发生了丢失,而这种损坏在对数据块进行读取时才会被发现。数据块损坏不仅出现在磁盘中,在固态硬盘中,由于频繁的编程/擦除,数据块损坏的情形也很常见。因此,在考虑分布式存储中的数据修复时,需要考虑节点和数据块修复的组合情形。纠删码和再生码提供的数据冗余都是以数据节点为单位的,损坏的数据块会以数据节点故障的方式得到修复,显然,这会造成资源的浪费。

综上,应用于分布式存储中的存储编码,需要考虑如下几个方面:

第一,存储效率,代表编码方案为RS码;

第二,修复带宽,代表编码方案为再生码;

第三,I/O,代表编码方案为RBT码;

第四,损坏模式,包括存储节点故障和节点数据块损坏。

目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710164230.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top