[发明专利]一种提高重复数据删除备份系统恢复性能的数据布局方法有效
申请号: | 201610351498.5 | 申请日: | 2016-05-25 |
公开(公告)号: | CN106066818B | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 谭玉娟;文舰;晏志超 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于数据块存储地址的数据布局方法,用于提高重复数据删除备份系统的恢复性能。该方法充分考虑每个数据块的具体存储位置,并结合磁盘的带宽和寻道时间,在备份时计算数据的恢复速度,若恢复速度满足用户需求,则认为对应的数据不是数据碎片,反之则是数据碎片。与已有方法不同的是,该方法是一种基于数据块存储地址的数据布局方法,碎片识别时使用更加细粒度的碎片识别方式,能精确定位每一个碎片。通过这种方法,可以获得比其他方法更高的重删率和数据恢复性能。 | ||
搜索关键词: | 一种 提高 重复 数据 删除 备份 系统 恢复 性能 布局 方法 | ||
【主权项】:
1.一种提高重复数据删除备份系统恢复性能的数据布局方法,具体步骤为:(1)对需要备份的数据集使用数据块变长算法进行不定长分块,然后采用哈希算法计算每个数据块的指纹;(2)在指纹查找表中查询步骤(1)中计算得到的数据块指纹,若不存在该指纹,则标记对应的数据块为新数据块;反之若存在该指纹,则说明对应的数据块已经被存储过,标记该数据块为重复数据块,并记录所述重复数据块的存储地址;(3)对步骤(2)得到的重复数据块进行分组操作,即把这些重复数据块按照数据块的存储地址进行排序,将相邻的存储地址间隔小于分组阈值的数据块分为一个组,而相邻的存储地址间隔大于或等于分组阈值的数据块则被分到两个不同的组;(4)对步骤(3)所得到的每个组进行碎片识别,若在一个组中,恢复或读取某个数据集对象时,该组内的有效数据块的传输速度低于用户所期望的传输速度,则该组内的有效数据块被标记为数据碎片,反之,则该组内的有效数据块被标记为非碎片数据块;(5)删除步骤(4)中识别出的非碎片数据块,存储步骤(4)中识别出的数据碎片以及步骤(2)中标记出的新数据块并记录所述数据碎片和所述新数据块的存储地址;(6)根据所述新数据块以及所述数据碎片在步骤(5)获得的存储地址更新指纹查找表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610351498.5/,转载请声明来源钻瓜专利网。
- 上一篇:时钟监控电路及其方法
- 下一篇:一种备份信息的方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置