[发明专利]一种面向大数据的云容灾备份方法有效
申请号: | 201510350060.0 | 申请日: | 2015-06-19 |
公开(公告)号: | CN104932956B | 公开(公告)日: | 2018-02-27 |
发明(设计)人: | 林伟伟;张子龙;钟坯平 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 陈宏升 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 数据 云容灾 备份 方法 | ||
1.一种面向大数据的云容灾备份方法,其特征在于,包含以下顺序的步骤:客户端通过建立文件块哈希指纹和快照指针实现对文件不同版本的压缩存储备份,同时客户端将文件块指纹传输给私有云存储系统;私有云建立文件块指纹索引数据库,通过MapReduce任务比对哈希指纹来对传输块进行初步去重,对数据块进行细粒度的基于内容的再次分块哈希,通过另一个MapReduce子任务计算数据块的相似度矩阵和块指针分布,由HDFS统计数据块的访问热度,并将指纹索引数据库与热数据缓存在存储前段,将冷数据以及归档备份数据集中存储并建立版本快照,定时备份在公有云存储系统实现异地容灾。
2.根据权利要求1所述的面向大数据的云容灾备份方法,其特征在于,该方法具体包含以下步骤:
S1.建立文件存储系统客户端,客户端按照基于内容的分块算法对文件进行分块,对每个数据块生成指纹信息,通过建立数据块快照对文件进行本地压缩存储备份并传输至私有云存储系统;
S2.以控制与传输分离的数据传输方式建立基于HDFS的私有云存储系统,在快速存储介质SSD上创建分布式数据块指纹数据库索引层和块数据缓存层;
S3.通过对数据块指纹的并行检索和相似度计算来实现重复数据删除,运行两个以流水技术相互叠加的MapReduce任务,其中,第一个MapReduce任务实现对数据块指纹的快速索引,在索引未命中时,启动第二个MapReduce任务对数据块进行基于内容识别的相似度计算,生成指纹相似度矩阵和块指针分布进一步增强重复数据删除技术;
S4.在私有云平台上建立基于内容识别的数据分块和统计,在分类基础上对用户访问进行统计,将访问频率较高的数据重组和缓存,重新生成指纹和指针分布,对访问频率较低的数据进行压缩和归档;
S5.建立基于公有云的异地容灾策略,对冷数据的定时归档和对热数据的按计划定时备份,所述冷数据为访问频率较低的数据,热数据为访问频率较高的数据。
3.根据权利要求1所述的面向大数据的云容灾备份方法,其特征在于:所述的客户端以非对称加密技术对客户端数据加密存储,将私钥存储在服务端的密钥数据库,同时建立基于密文的检索系统。
4.根据权利要求1所述的面向大数据的云容灾备份方法,其特征在于:所述的客户端对文件进行本地压缩存储备份,是以MD5压缩技术生成数据块摘要,以库文件的形式提供一组与POSIX和WebDAV规范兼容的接口,模拟出各种已知的应用协议,客户端通过操作系统的统一接口来透明地访问私有云的存储空间。
5.根据权利要求1所述的面向大数据的云容灾备份方法,其特征在于:所述的定时备份具体为:通过将加密之后的私有云存储逻辑卷定时上传到公有云中做备份来实现每周一次或每日一次的数据归档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510350060.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置