[发明专利]一种分布式存储系统中数据分布的方法及装置有效
申请号: | 201710312963.9 | 申请日: | 2017-05-05 |
公开(公告)号: | CN107168649B | 公开(公告)日: | 2019-12-17 |
发明(设计)人: | 强慧媛;杨洪章 | 申请(专利权)人: | 南京城市职业学院 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 32252 南京钟山专利代理有限公司 | 代理人: | 戴朝荣 |
地址: | 210038 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 存储系统 数据 分布 方法 装置 | ||
本发明提供一种分布式存储系统中数据分布的方法及装置,其中,所述方法包括:当所述分布式存储系统初始化时,加载初始化信息;当在所述分布式存储系统中写入目标文件时,根据所述目标文件的尺寸以及文件块尺寸,将所述目标文件划分为多个切片;在所述分布式存储系统中的节点中确定逻辑起始点,并确定逻辑分组长度;将节点按照逻辑分组长度划分为多个逻辑组,并在各个逻辑组中分别选取一个偏移节点;基于所述逻辑起始点、各个偏移节点以及节点总数,确定物理分组;将根据所述目标文件划分得到的所述多个切片依次存放于所述物理分组内的各个节点中。本发明提供的技术方案,能够同时满足均衡性高、可靠性强、计算量小的评价指标。
技术领域
本发明涉及数据存储技术领域,特别涉及一种分布式存储系统中数据分布的方法及装置。
背景技术
在分布式存储系统中,文件的数据内容以块为粒度进行切分并将其分散存储在不同的存储节点中,已成为一种通常的处理手段(以下简称分布式的处理手段)。块的尺寸可根据系统中普遍的文件尺寸进行设置,典型的块大小为4KB至4MB不等。相较于集中式的处理手段,分布式的处理手段通过数据块分散存储在不同节点,可以充分地发挥存储系统的并发处理能力。例如读取同一个尺寸为64MB的文件,集中式的处理手段产生的时延为一次读取64MB的时延,而分布式的处理手段产生的时延仅为64路并发读取1MB的时延,显然分布式的处理手段大幅降低了读取操作的时延。
因此,文件的数据内容在以块为粒度切分之后,如何分布在各存储节点中,成为当前分布式存储系统领域的重要技术热点。一般地,评价一种数据分布方法的优劣,主要从均衡性、可靠性以及计算量方法进行考量。
现有的数据分布方法包括:
1.随机选取方法。该种方式在为数据块分配节点时完全随机,从宏观上来说,对于大规模的存储系统而言,各节点的数据块将会十分均衡;计算量也很小;但这种完全随机的方法无法显性地控制数据的各副本不在同一个故障域中,一种极端的情况甚至是同一文件的各数据块及副本被分配到同一节点中。另外,在小规模的存储系统中,各节点的均衡性难以保证。
2.固定分段选取方法。该种方式根据故障域进行分段,在段内进行随机选取节点,这种方式提供了较好的可靠性,计算量也不大,但是由于故障域是固定的,因此分段也是固定的,数据分布结果的可能性十分有限;同时,在节点数量无法被段数整除的情况下,亦无法保证各段的节点数量相等,因此均衡性难以得到满足。
3.哈希选取方法。该种方式为每一个切片分配一个全局唯一的号码,并通过某种计算规则求得散列值,然后对节点数进行求余操作,其余数即为切片所存储的节点。该种方法具有较好的均衡性,但计算量较大,可靠性略差。
由上可见,现有技术中的数据分布存储方法,均无法同时满足均衡性高、可靠性强、计算量小的评价指标。
发明内容
本发明的目的在于提供一种分布式存储系统中数据分布的方法及装置,能够同时满足均衡性高、可靠性强、计算量小的评价指标。
为实现上述目的,本发明提供一种分布式存储系统中数据分布的方法,所述方法包括:当所述分布式存储系统初始化时,加载初始化信息;其中,所述初始化信息包括所述分布式存储系统中的节点总数、单文件分配节点数以及文件块尺寸;当在所述分布式存储系统中写入目标文件时,根据所述目标文件的尺寸以及所述文件块尺寸,将所述目标文件划分为多个切片;在所述分布式存储系统中的节点中确定逻辑起始点,并根据所述节点总数和所述单文件分配节点数,确定逻辑分组长度;将所述分布式存储系统中的节点按照逻辑分组长度划分为多个逻辑组,并在各个逻辑组中分别选取一个偏移节点;基于所述逻辑起始点、各个偏移节点以及所述节点总数,确定物理分组;其中,所述物理分组中的节点的数量与所述偏移节点的数量相同;将根据所述目标文件划分得到的所述多个切片依次存放于所述物理分组内的各个节点中。
进一步地,按照下述公式将所述目标文件划分为多个切片:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京城市职业学院,未经南京城市职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710312963.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置