[发明专利]I/O优化的分布式存储数据修复方法有效
申请号: | 201710164230.5 | 申请日: | 2017-03-17 |
公开(公告)号: | CN106911793B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 骆源;何奇芫;应臣浩 | 申请(专利权)人: | 上海交通大学 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F11/14 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优化 分布式 存储 数据 修复 方法 | ||
本发明提出了一种I/O优化的分布式存储数据修复方法:包括如下任一个或任多个步骤:‑针对故障节点的RBT帮助数据块,可以利用修复故障节点时下载的数据计算得到数据块的内容,不需要读取或下载新的数据;‑对于非RBT帮助数据块,通过计算数据块的公共修复集合,减小从磁盘读取的数据。本发明实现了在节点故障和数据块损坏组合模式下数据修复时的I/O优化。
技术领域
本发明属于存储编码技术领域,具体是一种I/O优化的分布式存储数据修复方法,该方法实现分布式存储中数据修复时的I/O优化。
背景技术
如今,在大型分布式存储中,存储数据的总量以指数级的方式增长着。存储系统会面临许多数据节点临时失效或永久失效的问题,为了保证系统的可靠性,大多数存储系统会选择给数据提供备份。例如Google文件系统就采用了3倍备份的方法。备份得到应用的原因是实现方便,易操作,数据恢复简单并且可靠。然而,由于数据量的极速增长,备份的方法给存储开销带来了极大的负担。
纠删码为存储系统提供了另一个选择,与备份相比,它能在低冗余的前提下,提供较好的数据可靠性。尤其是Reed-Solomon(RS)码在分布式存储中得到了大量的应用。据报道,Facebook通过采用RS码替代备份的方法,节约了PB级字节的存储开销。
在RS码中,文件被编码后存储到多个节点上,数据节点的个数为k,校验节点的个数为r。(k+r)个节点共同构成了分布式存储系统,(k+r)个节点中的任意k个节点都能用来恢复得到原始文件,存储系统的容错能力为r个节点。
RS码在修复节点故障时,是用k个节点先得到所有原始文件,然后再对节点损坏的数据进行修复。这个过程的传输带宽是k个节点上存储的数据总量。分布式存储中节点故障的情形大多为单节点故障,而这种以恢复原始文件来修复单个故障节点的方法,会对系统资源造成极大的负担。
再生码(Regenerating codes)很好的解决了节点修复时的带宽问题。再生码在节点数据下载前会在节点内部进行运算,下载的数据为运算后的结果。这样,再生码通过从d(>k)个节点分别下载一小部分数据来实现节点修复。再生码适用于带宽资源紧缺的分布式存储系统。
再生码能够优化节点修复过程中的带宽,但是再生码在节点内部的运算会首先读取整个节点上的数据,节点修复过程中的I/O是d个节点上的所有数据。这个值高于RS码的k个节点数据,对系统的I/O资源带来了较大的负担。随着存储系统计算能力的增强,影响节点修复性能的主导因素成为了I/O,即从磁盘上读取的数据量。I/O已经成为了分布式存储的重要资源,更是许多分布式系统的性能瓶颈。Reconstruct-by-Transfer(RBT)码实现了节点修复过程中的I/O优化。RBT码的结构基于再生码,其特点是存储数据为节点参与修复时的计算数据,而不直接存储编码数据。
相比于节点故障,更为常见的故障情形是数据块损坏。数据块损坏是节点上的某一块数据发生了丢失,而这种损坏在对数据块进行读取时才会被发现。数据块损坏不仅出现在磁盘中,在固态硬盘中,由于频繁的编程/擦除,数据块损坏的情形也很常见。因此,在考虑分布式存储中的数据修复时,需要考虑节点和数据块修复的组合情形。纠删码和再生码提供的数据冗余都是以数据节点为单位的,损坏的数据块会以数据节点故障的方式得到修复,显然,这会造成资源的浪费。
综上,应用于分布式存储中的存储编码,需要考虑如下几个方面:
第一,存储效率,代表编码方案为RS码;
第二,修复带宽,代表编码方案为再生码;
第三,I/O,代表编码方案为RBT码;
第四,损坏模式,包括存储节点故障和节点数据块损坏。
目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710164230.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型复合保暖棉枕
- 下一篇:一种超微型特种漆包线
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置