[发明专利]一种具有预恢复功能的文件级连续数据保护方法有效

专利信息
申请号: 201110250955.9 申请日: 2011-08-29
公开(公告)号: CN102279778A 公开(公告)日: 2011-12-14
发明(设计)人: 曹强;黄建忠;谢长生;李欣;叶松 申请(专利权)人: 华中科技大学
主分类号: G06F11/14 分类号: G06F11/14
代理公司: 华中科技大学专利中心 42201 代理人: 曹葆青
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 具有 恢复 功能 文件 连续 数据 保护 方法
【说明书】:

技术领域

发明属于数据存储领域,具体涉及一种具有预恢复功能的文件级连续数据保护方法。该方法能够实现在时间和空间两个维度上的预恢复功能,减少用户的恢复时间。

背景技术

目前,连续数据保护(Continuous Data Protection,CDP)是最热门的数据保护方式。连续数据保护能够持续捕获和保存数据变化,并将变化后的数据独立于初始数据进行保存。利用连续数据保护,用户可以将数据恢复到过去任意一个时间点,从时间上极大地保护了用户数据。在业界,有两个重要指标用来衡量一个数据保护系统:RTO(Recovery Time Object,恢复时间目标)和RPO(Recovery Point Object,恢复点目标)。RTO表示在发现故障后,多长时间可以恢复数据和系统的正常运行,简单的理解就是恢复数据时的时间开销。RTO越小越好,理论上立即恢复(RTO=0)是最佳。RPO表示在发现故障后,数据和业务能够恢复到出现故障时的多长时间以前,简单的理解就是恢复数据后所丢失的数据量。例如:用户早上8点备份了数据,而中午12点时数据丢失损坏。此时,如果用户用早上8点的数据进行恢复,那么RPO就是4小时。同样RPO也是越小越好,理论上一点数据都不丢(RPO=0)是最好。

连续数据保护方法根据保护粒度的不同分为:块级、文件级和应用级。块级连续数据保护实现简单,但是灵活性不好,且不能提供语义。在用户需要将某一文件恢复到过去某一个时刻时,首先要将这个文件所在的卷恢复到过去的那个时刻,然后才能得到此文件。同时由于块级连续数据保护不能提供语义,所以不能保证已经恢复了的文件是完整可用的版本,这大大增加了RTO。文件级连续数据保护是以文件为基本粒度进行的,能够拦截用户对文件的I/O请求,并对文件改变进行保护。文件级连续数据保护维护了同一个文件在时间上的不同版本,每一个版本都是完整可用的。文件级连续数据保护具有语义,并有很好的灵活性。目前,文件级连续数据保护是企业界和计算机科学家们共同的关注热点。

在理论上和实际中文件级连续数据保护的RPO都为0,但是RTO往往比较大,成为了文件级连续数据保护发展的一个瓶颈。主要的原因在于大多数情况下用户并不知道故障的确切发生时间,即用户并不知道需要将数据恢复到哪一个时间点。所以在实际中经常发生这样的情况:用户先将部分文件恢复到过去的某一个时间点,查看这些恢复后的文件,确定故障是在这个时间点之前还是之后发生的;然后再将部分文件恢复到在此之前或者之后的某一个时间点,往复几次后,确定了真正需要恢复的时间点,之后才将所需要的全体数据进行恢复。事实上用户会多次恢复多个文件到过去的多个时间点来确定真正需要恢复的时间点。因此在实际应用中的RTO是以下三部分操作的时间之和:为了确定真正需要的恢复时间点所进行的对多个文件的多次恢复操作的时间消耗(简称为:恢复测试文件时间)、用户阅读判断测试文件的时间消耗(简称为:用户判断时间)和恢复所需全部数据的恢复时间消耗(简称为:恢复时间)。其中,恢复测试时间和用户判断时间是不可测因素,成为RTO居高不下的一个重要原因。

频繁模式挖掘算法是数据挖掘中很重要的一个方向,目前已有一些经典算法,例如Apriori算法等,具体参见《数据挖掘原理与算法》毛国君著清华大学出版社,ISBN:7302106312;《数据挖掘导论》[美]Pang-Ning TanMichael Steinbach Vipin Kumar著人民邮电出版社ISBN:7115141444。

发明内容

本发明的目的在于提供一种具有预恢复功能的文件级连续数据保护方法,该方法能够有效的减少RTO。

本发明提供的一种具有预恢复功能的文件级连续数据保护方法,包括保护过程和恢复过程,其特征在于,该方法还包括挖掘过程,挖掘过程利用频繁模式挖掘算法,通过挖掘保护过程中收集到的I/O序列,得到I/O请求之间的关联关系,以此对恢复过程中用户的输入进行预测,并根据预测得到的结果提前进行恢复,以减少RTO。

所述恢复过程按照步骤R1至R14进行:

R1初始化:建立目标文件队列NF,预恢复文件队列PF,已恢复文件库ND,并初始化NF、PF和ND为空;其中,NF,PF和ND中的每一个元素均是一个二元组,拥有两个属性:文件路径和目标时间;

R2接收来自用户的恢复请求,得到目标文件F和目标恢复时间点T;

R3在已恢复文件库ND中查找F和T,如果找到,将F和T加入目标文件队列NF,然后进入步骤R6;如果没有在ND中找到F和T,进入步骤R4;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110250955.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top