[发明专利]一种用于大数据存储系统的数据压缩引擎及方法有效
申请号: | 201710483336.1 | 申请日: | 2017-06-22 |
公开(公告)号: | CN107463606B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 陈海江;周岐武 | 申请(专利权)人: | 浙江力石科技股份有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F16/13;G06F16/182;G06F16/17 |
代理公司: | 北京青松知识产权代理事务所(特殊普通合伙) 11384 | 代理人: | 郑青松 |
地址: | 311121 浙江省杭州市余杭区文一西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 数据 存储系统 数据压缩 引擎 方法 | ||
1.一种用于大数据存储系统的数据压缩引擎系统,其特征在于,包括:
请求识别单元,对于大数据存储系统的任何一个客户端节点提出的写入请求或访问请求,判断该写入请求或访问请求针对的文件是否为小文件;如果是小文件则将所述写入请求转至小文件分配管理单元,将所述访问请求转至访问请求响应单元;
小文件分配管理单元,根据请求识别单元转来的所述写入请求,将待上传的小文件分配给大数据存储系统下的数据节点集群当中的一个或多个固定的新增小文件接收数据节点;向提出写入请求的客户端节点返回被分配的新增小文件接收数据节点的信息,以便该客户端节点将该小文件作为一个分块发送至该新增小文件接收数据节点进行存储;并且维护一个新增小文件元数据表,为该小文件在该表中登记一个新建的元数据项;
并且,小文件分配管理单元还用于维护高热度等级元数据表、中等热度等级元数据表和低热度等级元数据表;对于在新增小文件元数据表中登记并且由新增小文件接收数据节点存储的新增小文件,根据访问请求热度统计单元确定的该新增小文件的访问热度等级属于高热度等级、中等热度等级还是低热度等级,在相应热度等级对应的元数据表中为该小文件建立和维持元数据项;并且,向新增小文件接收数据节点下达指令,将该小文件传输给被分配存储该小文件的数据节点;其中,对于高热度等级的小文件,被分配存储该小文件的数据节点将其作为一个单独的分块进行存储;对于中等热度等级的小文件,将其合并为Sequence file更大的文件结构,然后由被分配存储该合并的文件结构的数据节点进行存储;对于低热度等级的小文件,将其合并为Sequence file更大的文件结构,并且对该文件结构进行数据压缩处理,然后由被分配存储该合并且压缩的文件结构的数据节点进行存储;
访问请求热度统计单元,用于统计大数据存储系统下的每个小文件在单位时间内被全部客户端节点所请求访问的次数,根据该次数判定各个小文件所属的访问热度等级属于高热度等级、中等热度等级还是低热度等级;将所述访问热度等级传输给小文件分配管理单元;
访问请求响应单元,响应请求识别单元转来的访问请求,为该访问请求创建一个访问任务,根据该访问请求提供的小文件标识符查询高热度等级元数据表、中等热度等级元数据表和低热度等级元数据表,确定该小文件所在的文件、分块及其数据节点的网络地址,向提出该访问请求的客户端节点反馈以上信息。
2.根据权利要求1所述的数据压缩引擎系统,其特征在于,在对低热度等级的小文件进行合并且压缩的过程中,选取一定数量的同源的小文件,合并为Sequence file更大的文件结构。
3.根据权利要求2所述的数据压缩引擎系统,其特征在于,所述访问请求热度统计单元持续性地统计监测所有客户端节点对于所有小文件的访问请求,更新所有小文件的访问热度等级,并将小文件访问热度等级的变化通知所述小文件分配管理单元;并且,
响应原属于低热度等级的小文件变更为高热度等级,小文件分配管理单元从合并且压缩后的文件结构当中解压缩并分离出该小文件内容,作为一个独立的分块,存储于该数据节点上,并且更新高热度等级元数据表;
响应原属于低热度等级的小文件变更为中等热度等级,小文件分配管理单元从合并且压缩后的文件结构当中解压缩并分离出该小文件内容,作为一个独立的分块,存储于该数据节点上,当该数据节点上以独立分块形式存在的中等热度等级的小文件积累到一定数量,则可以将这些小文件合并为一个Sequence file更大的文件结构;并且更新中等热度等级元数据表;
响应原属于高热度等级的小文件变更为中等热度等级或者低热度等级,小文件分配管理单元向存储该小文件的分块的数据节点发出指令,通知该数据节点此以独立分块形式存在的小文件已经允许被合并,或已经允许被合并且压缩;当该数据节点上允许被合并、或允许被合并且压缩的以独立分块形式存在的小文件积累到一定数量,则可以将这些小文件合并为一个Sequence file更大的文件结构,或者合并为更大的文件结构并且对该文件结构执行压缩运算;并且更新中等热度等级元数据表或低热度等级元数据表。
4.根据权利要求3所述的数据压缩引擎系统,其特征在于,针对高热度等级的小文件,访问请求响应单元建立常驻的访问任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江力石科技股份有限公司,未经浙江力石科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710483336.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置