[发明专利]一种基于因果关系的重复数据删除方法有效
申请号: | 201110115298.7 | 申请日: | 2011-05-05 |
公开(公告)号: | CN102184218A | 公开(公告)日: | 2011-09-14 |
发明(设计)人: | 冯丹;谭玉娟;田磊;许蔚;晏志超 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F11/14 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 因果关系 重复 数据 删除 方法 | ||
技术领域
本发明属于计算机信息存储技术领域,具体涉及一种用于改善云备份服务能力的基于因果关系的重复数据删除方法。
背景技术
随着云计算的兴起,云备份也越来越受大家的欢迎。作为一种根据使用时间来付费的方式,云备份增加了用户使用备份功能的自由性,可以使用户拥有最高的备份性价比。这种自由性吸引了各大中小型企业、远程移动办公室以及个人用户的青睐。尤其是对于小型企业来说,他们不想成为一个备份专家,他们需要花更多的时间来进行企业的自身业务的完善,需要以此来提高企业本身的利润。而云备份刚好满足了他们的要求。云备份的简单的使用方式,可以使小型企业既能很好的保护好自己的数据,又能使企业的员工有更多的时间,更好的专注于企业自身的建设。
不过目前的云备份系统有着自己固有的缺陷,那就是链接云备份用户和云备份服务提供者之间的是带宽极低的广域网络,这就使得云备份系统中的数据备份和数据恢复速度极慢。根据国外权威机构统计,有大约39%的人认为在关于广域网络上进行的备份和恢复所花的时间太长,有31%的人认为在广域网上进行备份和恢复所需要花费的网络开销太大。正因为此,云备份还没有成为一个广泛使用的,经济可行的备份方式,没有达到预期的效果。目前,学术界和工业界正在努力改善云备份的服务能力,宣传和推广云备份的使用。不过,不管是学术界还是工业界,目前都仅仅关注数据备份速度的提升。他们通过使用源端的重复数据删除方法,消除重复数据的备份,以此来减少备份过程中广域网络带宽的使用,加快备份任务的完成。他们使用的方法仅用于提升备份的速度,而没有提升恢复的速度。但是在云备份系统中,备份的数据都必须用于恢复。并且2009年赛门铁克的灾难恢复的调研报告中指出,和以往相比,现在进行数据恢复时平均每小时所花费的代价比以往更高,这就意味着数据恢复的时间比以往更加紧迫。因此,一种有效的用于改善云备份服务能力的重复数据删除方法是不仅能删除重复的备份数据,提高数据备份的速度,同样也能消除重复的恢复数据,加快恢复数据的传输,改善数据恢复的性能。
发明内容
本发明提出了一种用于改善云备份服务能力的基于因果关系的重复数据删除方法,该方法根据所捕捉的数据文件之间的因果关系,消除在备份和恢复任务中的重复数据,加快备份和恢复数据的传输,提高云备份系统中数据备份和恢复的速度,使云备份系统切实可用。
一种基于因果关系的重复数据删除方法,涉及文件关系表和文件指纹谱集,所述文件关系表包含文件名、文件操作类型和文件操作时间信息,所述文件指纹谱集包含各文件的文件数据块指纹和文件备份时间信息;该方法包括数据备份步骤和数据恢复步骤;
所述数据备份步骤,具体为:
(A1)本地客户端接受用户备份任务请求,备份任务请求携带的信息有待备份文件名和最近一次备份时间;
(A2)查询文件关系表,判断待备份文件是否在最近一次备份时间之后进行过修改,若是,则进入步骤(A3),否则,结束备份;
(A3)提取待备份文件当前的数据块指纹,将其与文件指纹谱集记录的待备份文件最后一次备份时的数据块指纹进行匹配,找出匹配失败的数据块;
(A4)对步骤(A3)中匹配失败的数据块进行备份;
(A5)在文件指纹谱集记录待备份文件当前的数据块指纹和备份时间;
所述数据恢复步骤,具体为:
(B1)本地客户端接收用户恢复任务请求,恢复任务请求携带的信息有待恢复文件的文件名和待恢复时间点;
(B2)查询文件关系表,判断待恢复文件是否在离待恢复时间点的最近一次备份后进行过修改,若是,则进入步骤(B3),否则,结束恢复;
(B3)提取待恢复文件当前的数据块指纹;
(B4)从文件指纹谱集中查询待恢复文件离待恢复时间点最近一次备份的数据块指纹,将其与步骤(B3)提取的数据块指纹进行匹配,找出匹配失败的数据块;
(B5)对步骤(B4)中匹配失败的数据块进行恢复。
本发明具有如下的特点:
(1)本发明的重复数据删除方法通过捕捉和利用文件之间的因果关系,不仅消除了重复的备份数据,也能消除重复的恢复数据,减少了数据备份和恢复中网络带宽的使用,解决了云备份系统中因低带宽广域网络带来的数据备份和恢复速度极慢的问题。
(2)本发明的重复数据删除方法改善了云备份的服务能力。通过消除数据备份和数据恢复中存在的冗余数据,大大减少了云备份系统中数据备份和恢复所需要的时间,加快了云备份系统中数据备份和数据恢复的速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110115298.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实时数据库的构建方法和数据检索方法
- 下一篇:内容选取方法及其触控系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置