[发明专利]用于检测复制内容区块之间的差异的方法和系统有效
申请号: | 201310741125.5 | 申请日: | 2013-12-27 |
公开(公告)号: | CN103902408B | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 伯特兰·塞尔勒特;路易斯·莫尼耶 | 申请(专利权)人: | 西部数据技术公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 万里晴 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及使用布隆过滤器检测副本之间的偏差。提供的技术使用近乎满的布隆过滤器,用于有效地识别其中副本之间的偏差足以调整纠正措施的散列片段。所描述的技术也用于调整片段的尺寸和布隆过滤器的尺寸,从而使得布隆过滤器间的比较被用作片段对的片段内容偏差程度的精确指示器。片段尺寸可以在片段对之间有所不同,从而使得通过相对大的片段来表示环的相对稀少的驻足部分(更少的块落入存取码范围内),而通过相对较小的片段来表示环的相对密集的驻足部分(更多的块落入存取码范围内)。 | ||
搜索关键词: | 使用 过滤器 检测 副本 之间 偏差 | ||
【主权项】:
一种用于检测复制内容之间的差异的方法,包括:在第一区块存储器中存储第一区块组,其中,所述第一区块组中的每个区块对应于多个内容项中的一个内容项;通过计算区块中的内容的散列值,来生成所述第一区块组中的每个区块的存取码值;以字典顺序组织所述第一区块组中的区块的存取码值以形成第一环;其中,所述第一环表示所述第一区块组中的区块的存取码值的整个范围;将所述第一环再分成第一片段组;其中,所述第一片段组中的每个片段覆盖所述第一区块组中的区块的存取码值的整个范围的子范围;其中,所述第一片段组包括与特定子范围对应的第一片段;其中,所述第一区块存储器中的具有落入所述特定子范围内的存取码值的所有区块构成所述复制内容的第一副本的第一部分;在第二区块存储器中存储第二区块组,所述第二区块存储器是所述第一区块存储器的副本,其中,所述第二区块组中的每个区块对应于所述多个内容项中的一个内容项;通过计算区块中的内容的散列值,来生成所述第二区块组中的每个区块的存取码值;以字典顺序组织所述第二区块组中的区块的存取码值以形成第二环;其中,所述第二环表示所述第二区块组中的区块的存取码值的整个范围;将所述第二环再分成第二片段组;其中,所述第二片段组中的每个片段覆盖所述第二区块组中的区块的存取码值的整个范围的子范围;其中,所述第二片段组包括与特定子范围对应的第二片段;其中,所述第二区块存储器中的具有落入所述特定子范围内的存取码值的所有区块构成所述复制内容的第二副本的第二部分;基于所述第一区块组中的区块的落入特定子范围内的存取码生成用于所述第一片段的第一布隆过滤器;基于所述第二区块组中的区块的落入特定子范围中的存取码生成用于所述第二片段的第二布隆过滤器;在所述第一布隆过滤器与所述第二布隆过滤器之间执行比较;以及基于所述比较,确定所述第一副本的所述第一部分与所述第二副本的所述第二部分之间偏差是否超过特定阈值;其中,所述方法通过一个或多个计算设备来执行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西部数据技术公司,未经西部数据技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310741125.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种铁路货车制动系统
- 下一篇:铁路运输小汽车的专用车体