[发明专利]基于分布式存储系统的数据处理方法有效
申请号: | 201810018627.8 | 申请日: | 2018-01-09 |
公开(公告)号: | CN107948334B | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 许广彬;郑军;张银滨;李忠文 | 申请(专利权)人: | 无锡华云数据技术服务有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 苏州友佳知识产权代理事务所(普通合伙) 32351 | 代理人: | 储振 |
地址: | 214125 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分布式 存储系统 数据处理 方法 | ||
本发明提供了基于分布式存储系统的数据处理方法,包括:定义至少包含压缩模式、离线压缩起始时间及离线压缩终止时间的压缩配置项;当写入待处理数据时,由客户端、服务端或者客户端与服务端先后对待处理数据执行链式压缩处理,并仅在离线压缩模式下根据离线压缩起始时间及离线压缩终止时间确定服务端介入执行链式压缩处理的时刻;当读取待处理数据时,至少由客户端执行链式解压缩处理;并在执行链式压缩处理或者链式解压缩处理后通过网络向对端设备进行响应。通过本发明,可提高带宽利用率,节省存储空间,加快数据重构速度,提高了分布式存储系统在执行写入操作或者读取操作时的数据吞吐能力。
技术领域
本发明涉及分布式存储技术领域,尤其涉及一种基于分布式存储系统的数据处理方法。
背景技术
随着虚拟化、云计算和大数据的发展、分布式存储系统成为数据存储的主要方式,在开源分布式存储领域,分布式存储系统都采用了基于副本的冗余技术或EC技术。
CEPH是开源的统一分布式存储系统,是上述目前最主流的开源存储项目之一。CEPH基于C/S(客户端/服务器)架构实现,客户端可以通过RADOS对外提供对象访问接口,也可以在RADOS之上对外提供高层应用接口,高层应用接口包括RBD、RGW和Ceph FS;服务端包括OSD、MON和MDS,分别负责数据的存储、CEPH集群状态的管理和文件系统元数据的管理;
当通过RADOS或者高层应用接口RBD、RGW和Ceph FS向CEPH集群写入数据时,RADOS以对象(RADOS将接收到的数据块称为“对象”)名的hash值、存储池PG数、PG掩码等作为输入参数、通过CRUSH计算得到对象的目标OSDs。采用基冗余技术时,会得到一个OSD列表,其中列表中的第一个OSD称为主OSD,其他的OSD称为副本OSD。然后RADOS与主OSD建立TCP/IP连接,通过网络将数据传输到主OSD端。
采用基于副本的冗余技术时,主OSD与各个副本OSD建立TCP/IP连接,通过网络并行的将数据传输到各个副本OSD,同时将数据存储到本地磁盘中;在存储系统出现OSD或者节点故障时,由于数据是副本形式存储,系统内部会根据数据的副本自动进行故障OSD或者节点上的数据进行重建恢复,以保证数据的冗余性。
数据以多副本形式存储、所需的存储空间及存储成本随着副本数的增加线性的增长,以n(n∈N+)副本为例,所需的存储空间为实际存储数据量的n倍,存储利用率为1/n;基于副本的冗余技术、存储成本高且存储利用率底。相关参考文件如中国发明专利CN105635252 A。
如果采用基于EC的冗余技术时,主OSD首先根据EC编码规则分割数据块并生成校验块,然后与各个副本OSD建立TCP/IP连接,通过网络并行的将数据块传输到各个副本OSD,同时将数据存储到本地磁盘中;在存储系统出现OSD或者节点故障时,系统内部会根据剩余的数据块自动进行故障OSD或者节点上的数据进行重建恢复,为保证数据的冗余性。
数据根据EC编码规则分块存储、所需的计算量随着EC编码规则所确定的冗余度的增加线性的增长,以K+M模式为例,写入数据需要切割为K个子数据块,同时生成M个校验块;读取数据时,需要读取K个数据块,然后合并为完整的数据,当出现数据块损坏或者丢失时,还需要通过校验块重新生成损坏或者丢失的数据块。因此,基于EC的冗余技术进行数据写入与读取时就导致副本的冗余过大。
更重要的是,单纯地提高K与M的数量无疑于增加了IO延迟,并严重影响了基于CEPH或者其他类型的分布式存储系统的IO性能,并对计算机的CPU及内存造成了非常大的计算开销,并造成磁盘存储空间的极大浪费。
发明内容
本发明的目的在于公开一种基于分布式存储系统的数据处理方法,用以提高带宽利用率,节省存储空间,加快数据重构速度,提升分布式存储系统在执行写入操作或者读取操作时的存储性能,降低分布式存储系统的设备部署成本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡华云数据技术服务有限公司,未经无锡华云数据技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810018627.8/2.html,转载请声明来源钻瓜专利网。