[发明专利]基于分布式存储的重删方法、系统及数据重复检测方法在审
申请号: | 201710911706.7 | 申请日: | 2017-09-29 |
公开(公告)号: | CN107632789A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 王一斐 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分布式存储的重删方法、系统及数据重复检测方法,该数据重复检测方法包括将目标集群的存储空间划分为若干存储块;判断各存储块中是否存有数据;若是,则分别计算各存有数据的存储块的哈希值,并以对应的哈希值作为序号将相应的存储块加入到预设的排序二叉树中;判断排序二叉树中是否存在哈希值相同的存储块;若是,则判定哈希值相同的存储块中的数据为重复数据。在本技术方案中,通过将集群的存储空间划分为若干存储块,并将存储数据的存储块按照各自的哈希值加入到排序二叉树中,通过排序二叉树能够快速准确地命中重复数据,大大提高了集群中重复数据的判定效率,以便于后续的重删。 | ||
搜索关键词: | 基于 分布式 存储 方法 系统 数据 重复 检测 | ||
【主权项】:
一种基于分布式存储的数据重复检测方法,其特征在于,包括:将目标集群的存储空间划分为若干存储块;判断各所述存储块中是否存有数据;若是,则分别计算各存有数据的存储块的哈希值,并以对应的哈希值作为序号将相应的存储块加入到预设的排序二叉树中;判断所述排序二叉树中是否存在哈希值相同的存储块;若是,则判定所述哈希值相同的存储块中的数据为重复数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710911706.7/,转载请声明来源钻瓜专利网。
- 上一篇:检测装置
- 下一篇:一种防腐蚀的太阳能热水器支架