[发明专利]一种基于因果关系的重复数据删除方法有效

专利信息
申请号: 201110115298.7 申请日: 2011-05-05
公开(公告)号: CN102184218A 公开(公告)日: 2011-09-14
发明(设计)人: 冯丹;谭玉娟;田磊;许蔚;晏志超 申请(专利权)人: 华中科技大学
主分类号: G06F17/30 分类号: G06F17/30;G06F11/14
代理公司: 华中科技大学专利中心 42201 代理人: 李智
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 因果关系 重复 数据 删除 方法
【说明书】:

技术领域

发明属于计算机信息存储技术领域,具体涉及一种用于改善云备份服务能力的基于因果关系的重复数据删除方法。

背景技术

随着云计算的兴起,云备份也越来越受大家的欢迎。作为一种根据使用时间来付费的方式,云备份增加了用户使用备份功能的自由性,可以使用户拥有最高的备份性价比。这种自由性吸引了各大中小型企业、远程移动办公室以及个人用户的青睐。尤其是对于小型企业来说,他们不想成为一个备份专家,他们需要花更多的时间来进行企业的自身业务的完善,需要以此来提高企业本身的利润。而云备份刚好满足了他们的要求。云备份的简单的使用方式,可以使小型企业既能很好的保护好自己的数据,又能使企业的员工有更多的时间,更好的专注于企业自身的建设。

不过目前的云备份系统有着自己固有的缺陷,那就是链接云备份用户和云备份服务提供者之间的是带宽极低的广域网络,这就使得云备份系统中的数据备份和数据恢复速度极慢。根据国外权威机构统计,有大约39%的人认为在关于广域网络上进行的备份和恢复所花的时间太长,有31%的人认为在广域网上进行备份和恢复所需要花费的网络开销太大。正因为此,云备份还没有成为一个广泛使用的,经济可行的备份方式,没有达到预期的效果。目前,学术界和工业界正在努力改善云备份的服务能力,宣传和推广云备份的使用。不过,不管是学术界还是工业界,目前都仅仅关注数据备份速度的提升。他们通过使用源端的重复数据删除方法,消除重复数据的备份,以此来减少备份过程中广域网络带宽的使用,加快备份任务的完成。他们使用的方法仅用于提升备份的速度,而没有提升恢复的速度。但是在云备份系统中,备份的数据都必须用于恢复。并且2009年赛门铁克的灾难恢复的调研报告中指出,和以往相比,现在进行数据恢复时平均每小时所花费的代价比以往更高,这就意味着数据恢复的时间比以往更加紧迫。因此,一种有效的用于改善云备份服务能力的重复数据删除方法是不仅能删除重复的备份数据,提高数据备份的速度,同样也能消除重复的恢复数据,加快恢复数据的传输,改善数据恢复的性能。

发明内容

本发明提出了一种用于改善云备份服务能力的基于因果关系的重复数据删除方法,该方法根据所捕捉的数据文件之间的因果关系,消除在备份和恢复任务中的重复数据,加快备份和恢复数据的传输,提高云备份系统中数据备份和恢复的速度,使云备份系统切实可用。

一种基于因果关系的重复数据删除方法,涉及文件关系表和文件指纹谱集,所述文件关系表包含文件名、文件操作类型和文件操作时间信息,所述文件指纹谱集包含各文件的文件数据块指纹和文件备份时间信息;该方法包括数据备份步骤和数据恢复步骤;

所述数据备份步骤,具体为:

(A1)本地客户端接受用户备份任务请求,备份任务请求携带的信息有待备份文件名和最近一次备份时间;

(A2)查询文件关系表,判断待备份文件是否在最近一次备份时间之后进行过修改,若是,则进入步骤(A3),否则,结束备份;

(A3)提取待备份文件当前的数据块指纹,将其与文件指纹谱集记录的待备份文件最后一次备份时的数据块指纹进行匹配,找出匹配失败的数据块;

(A4)对步骤(A3)中匹配失败的数据块进行备份;

(A5)在文件指纹谱集记录待备份文件当前的数据块指纹和备份时间;

所述数据恢复步骤,具体为:

(B1)本地客户端接收用户恢复任务请求,恢复任务请求携带的信息有待恢复文件的文件名和待恢复时间点;

(B2)查询文件关系表,判断待恢复文件是否在离待恢复时间点的最近一次备份后进行过修改,若是,则进入步骤(B3),否则,结束恢复;

(B3)提取待恢复文件当前的数据块指纹;

(B4)从文件指纹谱集中查询待恢复文件离待恢复时间点最近一次备份的数据块指纹,将其与步骤(B3)提取的数据块指纹进行匹配,找出匹配失败的数据块;

(B5)对步骤(B4)中匹配失败的数据块进行恢复。

本发明具有如下的特点:

(1)本发明的重复数据删除方法通过捕捉和利用文件之间的因果关系,不仅消除了重复的备份数据,也能消除重复的恢复数据,减少了数据备份和恢复中网络带宽的使用,解决了云备份系统中因低带宽广域网络带来的数据备份和恢复速度极慢的问题。

(2)本发明的重复数据删除方法改善了云备份的服务能力。通过消除数据备份和数据恢复中存在的冗余数据,大大减少了云备份系统中数据备份和恢复所需要的时间,加快了云备份系统中数据备份和数据恢复的速度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110115298.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top