[发明专利]一种提高重复数据删除备份系统恢复性能的数据布局方法有效

专利信息
申请号: 201610351498.5 申请日: 2016-05-25
公开(公告)号: CN106066818B 公开(公告)日: 2019-05-17
发明(设计)人: 谭玉娟;文舰;晏志超 申请(专利权)人: 重庆大学
主分类号: G06F11/14 分类号: G06F11/14
代理公司: 暂无信息 代理人: 暂无信息
地址: 400044 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种基于数据块存储地址的数据布局方法,用于提高重复数据删除备份系统的恢复性能。该方法充分考虑每个数据块的具体存储位置,并结合磁盘的带宽和寻道时间,在备份时计算数据的恢复速度,若恢复速度满足用户需求,则认为对应的数据不是数据碎片,反之则是数据碎片。与已有方法不同的是,该方法是一种基于数据块存储地址的数据布局方法,碎片识别时使用更加细粒度的碎片识别方式,能精确定位每一个碎片。通过这种方法,可以获得比其他方法更高的重删率和数据恢复性能。
搜索关键词: 一种 提高 重复 数据 删除 备份 系统 恢复 性能 布局 方法
【主权项】:
1.一种提高重复数据删除备份系统恢复性能的数据布局方法,具体步骤为:(1)对需要备份的数据集使用数据块变长算法进行不定长分块,然后采用哈希算法计算每个数据块的指纹;(2)在指纹查找表中查询步骤(1)中计算得到的数据块指纹,若不存在该指纹,则标记对应的数据块为新数据块;反之若存在该指纹,则说明对应的数据块已经被存储过,标记该数据块为重复数据块,并记录所述重复数据块的存储地址;(3)对步骤(2)得到的重复数据块进行分组操作,即把这些重复数据块按照数据块的存储地址进行排序,将相邻的存储地址间隔小于分组阈值的数据块分为一个组,而相邻的存储地址间隔大于或等于分组阈值的数据块则被分到两个不同的组;(4)对步骤(3)所得到的每个组进行碎片识别,若在一个组中,恢复或读取某个数据集对象时,该组内的有效数据块的传输速度低于用户所期望的传输速度,则该组内的有效数据块被标记为数据碎片,反之,则该组内的有效数据块被标记为非碎片数据块;(5)删除步骤(4)中识别出的非碎片数据块,存储步骤(4)中识别出的数据碎片以及步骤(2)中标记出的新数据块并记录所述数据碎片和所述新数据块的存储地址;(6)根据所述新数据块以及所述数据碎片在步骤(5)获得的存储地址更新指纹查找表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610351498.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top