[发明专利]一种面向分布式文件系统的主动重复数据删除方法无效

专利信息
申请号: 201210328959.9 申请日: 2012-09-07
公开(公告)号: CN102880671A 公开(公告)日: 2013-01-16
发明(设计)人: 颜秉珩;张明富;张俊;张现忠;崔赢 申请(专利权)人: 浪潮电子信息产业股份有限公司
主分类号: G06F17/30 分类号: G06F17/30;H04L29/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 250014 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种面向分布式文件系统的主动重复数据删除方法,该方法基于分布式文件系统的I/O读写特点可以简化重复数据查找,将重复数据删除技术从后台移到前台,在将重复数据写入存储之前消除重复数据,其技术方案如下:在写入数据之前,首先通过数据位图校验当前数据是否已经存在,如果存在则修改数据目标指针,否则写入数据并更新数据目标指针,以此完成避免数据重复写入。该方法与现有技术相比,最大限度的节省存储空间,显著提高分布式文件系统的I/O速度。
搜索关键词: 一种 面向 分布式 文件系统 主动 重复 数据 删除 方法
【主权项】:
一种面向分布式文件系统的主动重复数据删除方法,其特征在于基于分布式文件系统的I/O读写特点,将重复数据删除技术从后台移到前台,在将重复数据写入存储之前主动完成重复数据的查询和删除工作,在写入数据之前,首先通过数据位图校验当前数据是否已经存在,如果存在则修改数据目标指针,否则写入数据并更新数据目标指针,以此完成避免数据重复写入,系统构成包括:客户端、元数据、存储服务器、Block摘要位图和文件,其中客户端通过查询元数据获取文件的物理存储位置,客户端与存储服务器直接交互进行数据传输,存储服务器通过查询block摘要位图确定输入数据是否已在文件中存在,具体实现步骤如下:(1)客户端通过查询元数据服务器获取文件的物理存储位置;(2)客户端与存储服务器直接交互进行数据传输;客户端缓存数据,构造若干block,同时计算每个block的数据块摘要值CRC32值,以block为单位进行数据传输,同时传输相应block的CRC32值;存储服务器接收到block以后,计算block的CRC32值,并验证与传输过来的CRC32值是否相同,完成数据传输校验;(3)存储服务器通过CRC32值查询block摘要位图,确定当前block是否已经存在系统之中:如果block已经存在,则修改chunk中的地址指向已经存在的block地址;否则将block写入本地存储,并将这个block的地址写入chunk。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210328959.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top