[发明专利]一种基于二进制的节点修复方法及系统有效
申请号: | 201711362784.2 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108628697B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 代明军;王霞;王晖 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06F11/10 | 分类号: | G06F11/10;H04L29/08 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 李利 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二进制 节点 修复 方法 系统 | ||
本发明适用于布式存储技术改进领域,提供了一种基于二进制的节点修复方法,所述节点修复方法包括以下步骤:S1、在piggyback编码框架上对(n,k)码将系统节点分组并定义系统向量和编码矩阵;S2、将定义的编码矩阵代入编码结构中获取相应的编码方式;S3、根据编码方式通过zigzag解码对受损节点进行修复。在分布式存储系统中,根据其特殊的编码方式,使设计的码即满足(n,k)性质;而且在节点修复过程中,可以有效的减小数据的读取量和下载量,从而提高修复效率。
技术领域
本发明属于分布式存储技术改进领域,尤其涉及一种基于二进制的节点修复方法及系统。
背景技术
在大型的分布式存储系统中,我们能存储和分析大规模的数据,然而在日常操作过程中,系统中的节点存在各种故障,例如:因磁盘损坏或者断线导致的数据丢失。因此,确保系统中节点的可靠性和可用性就显的尤为重要。
传统的分布式存储系统中,存储数据常常采用重复策略。即通过复制多个数据副本并存储在系统中的节点上。当有数据损坏需要进行数据恢复时,只需要找到对应的节点中所存储的数据,即可恢复。
近年来,相关学者提出了一种最大距离可分码(MDS),通过增加冗余来减小存储开销,同时保证节点在修复时数据的可靠性。其编码方式是:将原始的数据等分成k个原始数据包,然后将这k个原始数据包映射成n(n≥k)个编码数据包,任取k个编码数据包都可以恢复出k个原始数据包。其中最典型的RS码已经广泛的应用在现代数字通信、分布式存储系统中。
重复制的存储方式:由于每个节点都需要备份相应的数据副本,这样不仅会产生大量的冗余数据,加重服务器的负担,并且节点的利用率不高,造成资源的浪费。此外,随着系统中数据量的增加,存储开销也会呈指数型增加。
(n,k)码的在节点修复的过程中,需要读取所选取的修复节点中的全部数据,并下载下来,下载的数据量是所需恢复的数据量的k倍。这样不仅加重了网络带宽的负担,易损坏磁盘的性能。在修复过程中还过多的占用了系统的I/O口资源。并且在实际操作过程中,在某一特定的时间点,分布式存储系统中节点可能会不允许某些数据的读取或者下载请求。
发明内容
本发明的目的在于提供一种基于二进制的节点修复方法及系统,旨在解决修复效率低的技术问题。
本发明是这样实现的,一种基于二进制的节点修复方法,所述节点修复方法包括以下步骤:
S1、在piggyback编码框架上对(n,k)码将系统节点分组并定义系统向量和编码矩阵,定义系统向量:a={a1 a2 … ak}T,b={b1 b2 … bk}T,c={c1 c2 … ck}T,d={d1 d2 …dk}T;编码矩阵:
S2、将定义的编码矩阵代入编码结构中获取相应的编码方式;
S3、根据编码方式通过zigzag解码对受损节点进行修复;
其中,k表示系统节点的个数,r表示奇偶校验节点的个数,n=k+r,n表示总共节点个数,T代表向量的转置。
本发明的进一步技术方案是:所述步骤S1中r大于等于2,k/r为整数。
本发明的进一步技术方案是:所述步骤S1中在建立编码矩阵时通过移位生成存储开销,所述存储开销与奇偶校验节点和系统节点的个数有关,r越大,存储开销越大,k越大,存储开销越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711362784.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体器件
- 下一篇:计算CRC编码的方法和装置