[发明专利]一种用于大数据存储系统的数据压缩引擎及方法有效
申请号: | 201710483336.1 | 申请日: | 2017-06-22 |
公开(公告)号: | CN107463606B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 陈海江;周岐武 | 申请(专利权)人: | 浙江力石科技股份有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F16/13;G06F16/182;G06F16/17 |
代理公司: | 北京青松知识产权代理事务所(特殊普通合伙) 11384 | 代理人: | 郑青松 |
地址: | 311121 浙江省杭州市余杭区文一西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种用于大数据存储系统的数据压缩引擎及方法,针对HDFS系统中海量小文件,判定各个小文件所属的访问热度等级,设置与各个访问热度等级相对应的元数据表副本机制及检索进程数机制;其中,对于高热度等级的小文件不予以合并和压缩;对于中等热度等级的小文件引入合并处理,不予以压缩;对于低热度等级的小文件引入合并与压缩处理,并且将同源的小文件合并为一个更大的文件结构并进行数据压缩。另外,本发明会针对高热度等级的小文件建立常驻的访问任务,从而避免了访问任务频繁开设和回收所带来的低效现象。 | ||
搜索关键词: | 一种 用于 数据 存储系统 数据压缩 引擎 方法 | ||
【主权项】:
一种用于大数据存储系统的数据压缩引擎系统,其特征在于,包括:请求识别单元,对于大数据存储系统的任何一个客户端节点提出的写入请求或访问请求,判断该写入请求或访问请求针对的文件是否为小文件;如果是小文件则将所述写入请求转至小文件分配管理单元,将所述访问请求转至访问请求响应单元;小文件分配管理单元,根据请求识别单元转来的所述写入请求,将待上传的小文件分配给大数据存储系统下的数据节点集群当中的一个或多个固定的新增小文件接收数据节点;向提出写入请求的客户端节点返回被分配的新增小文件接收数据节点的信息,以便该客户端节点将该小文件作为一个分块发送至该新增小文件接收数据节点进行存储;并且维护一个新增小文件元数据表,为该小文件在该表中登记一个新建的元数据项;并且,小文件分配管理单元还用于维护高热度等级元数据表、中等热度等级元数据表和低热度等级元数据表;对于在新增小文件元数据表中登记并且由新增小文件接收数据节点存储的新增小文件,根据访问请求热度统计单元确定的该新增小文件的访问热度等级属于高热度等级、中等热度等级还是低热度等级,在相应热度等级对应的元数据表中为该小文件建立和维持元数据项;并且,向新增小文件接收数据节点下达指令,将该小文件传输给被分配存储该小文件的数据节点;其中,对于高热度等级的小文件,被分配存储该小文件的数据节点将其作为一个单独的分块进行存储;对于中等热度等级的小文件,将其合并为Sequence file等更大的文件结构,然后由被分配存储该合并的文件结构的数据节点进行存储;对于低热度等级的小文件,将其合并为Sequence file等更大的文件结构,并且对该文件结构进行数据压缩处理,然后由被分配存储该合并且压缩的文件结构的数据节点进行存储;访问请求热度统计单元,用于统计大数据存储系统下的每个小文件在单位时间内被全部客户端节点所请求访问的次数,根据该次数判定各个小文件所属的访问热度等级属于高热度等级、中等热度等级还是低热度等级;将所述访问热度等级传输给小文件分配管理单元;访问请求响应单元,响应请求识别单元转来的访问请求,为该访问请求创建一个访问任务,根据该访问请求提供的小文件标识符查询高热度等级元数据表、中等热度等级元数据表和低热度等级元数据表,确定该小文件所在的文件、分块及其数据节点的网络地址,向提出该访问请求的客户端节点反馈以上信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江力石科技股份有限公司,未经浙江力石科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710483336.1/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置