[发明专利]重复数据删除的处理系统无效

专利信息
申请号: 201010530413.2 申请日: 2010-10-21
公开(公告)号: CN102456059A 公开(公告)日: 2012-05-16
发明(设计)人: 朱明胜;陈志丰 申请(专利权)人: 英业达股份有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F11/14;H04L29/06
代理公司: 北京律诚同业知识产权代理有限公司 11006 代理人: 梁挥;张燕华
地址: 中国台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 重复 数据 删除 处理 系统
【权利要求书】:

1.一种重复数据删除的处理系统,将一输入文件通过一服务端与一客户端进行重复数据删除的处理,其特征在于,该重复数据删除的处理系统包括:

一客户端数据管理模块,于每一该客户端中设置该客户端数据管理模块,该客户端数据管理模块接收该输入文件,该客户端数据管理模块还包括:一数据切块模块、一指纹特征模块、一特征值查找模块,该数据切块模块用以将该输入文件进行一数据切分程序,并产生至少一数据区块;该指纹特征模块对该些数据区块进行一特征处理程序,并产生相应的一特征值;该特征值查找模块将每一该数据区块的该特征值与该客户端所储存的该些特征值进行比对,若该客户端中已存在相同的该特征值,则删除进行比对的该特征值相应的该数据区块,若该客户端中不存在相同的该特征值,则该客户端向该服务端发送一查询请求;以及

一服务端数据管理模块,通过网络连接于该客户端数据管理模块,该服务端数据管理模块还包括:一特征储存模块、一文件管理模块、一数据储存模块,该特征储存模块根据该查询请求判断该特征值是否已经记录于该服务端中,若该特征值不存在于该服务端中则向该客户端获取相应的该数据区块,并将新的该数据区块与该特征值储存于该服务端中;该文件管理模块用以将每一该输入文件的该些数据区块在该服务端的一储存地址记录至一索引文件中;该数据储存模块用以储存该些数据区块与该输入文件的一元数据。

2.根据权利要求1所述的重复数据删除的处理系统,其特征在于,该数据切分程序包括即定长切分、内容定义切分算法或滑动块切分。

3.根据权利要求1所述的重复数据删除的处理系统,其特征在于,该特征处理程序包括MD5、SHA1、SHA256或CRC32。

4.根据权利要求1所述的重复数据删除的处理系统,其特征在于,若该客户端中已存在相同的该特征值时,该特征值查找模块同时向该服务端发送一数据区块索引请求,该服务端更新该数据区块的一引用计数的数量,并且返回一数据区块结果,该数据区块结果包括该数据区块的后连续的多笔该特征值。

5.根据权利要求1所述的重复数据删除的处理系统,其特征在于,该客户端的该些特征值存储于一内存或一缓存中。

6.根据权利要求1所述的重复数据删除的处理系统,其特征在于,若该特征值已存在于该服务端中,则该特征储存模块将更新该数据区块的一引用计数的数量并且返回一数据区块结果,该数据区块结果包括该数据区块的后连续的多笔该特征值。

7.根据权利要求1所述的重复数据删除的处理系统,其特征在于,还包括一布隆过滤器,接收来自于该客户端的该特征值,该服务端通过该布隆过滤器判断所接收到的该数据区块是否已被修改过的该数据区块,并将判断结果输出至该特征储存模块。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英业达股份有限公司,未经英业达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010530413.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top