[发明专利]利用多种选择标准进行数据管理的方法和系统有效
| 申请号: | 200780004129.8 | 申请日: | 2007-11-21 |
| 公开(公告)号: | CN101379465A | 公开(公告)日: | 2009-03-04 |
| 发明(设计)人: | C·杜布尼基;K·利乔塔;E·克鲁斯;C·昂古里努 | 申请(专利权)人: | 美国日本电气实验室公司 |
| 主分类号: | G06F7/24 | 分类号: | G06F7/24 |
| 代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 刘杰;王小衡 |
| 地址: | 美国新*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 利用 多种 选择 标准 进行 数据管理 方法 系统 | ||
1.一种计算机实现的数据管理方法,包括以下步骤:
在处理单元处,利用第一内容定义的选择函数预先选择数据流中 的多个数据窗当中的一部分,所述第一内容定义的选择函数包括矩形 波串和函数、乘法线性同余发生器MLCG函数或者rolN-xor函数;以及
在处理单元处,利用第二内容定义的选择函数选择所述多个数据 窗当中的预先选择的所述部分的子集以最大化给定特性,
其中所述第一内容定义的选择函数在选择数据块边界方面比所述 第二内容定义的选择函数更快。
2.权利要求1的方法,其中,所述第一内容定义的选择函数在窗 选择方面比所述第二内容定义的选择函数更快。
3.权利要求1的方法,其中,所述第一内容定义的选择函数是矩 形波串和函数并且所述矩形波串和函数与关于所述矩形波串和的值的 选择标准相耦合。
4.权利要求1的方法,其中,所述第二内容定义的选择函数包括 Rabin指纹、SHA-1函数或者CRC32c函数。
5.权利要求1的方法,其中,所述第一内容定义的选择函数是滚 动窗函数。
6.权利要求1的方法,其中,所述多个窗被利用来定义供散列的 数据组,并且确定所述数据流中的断点的速度得到提高。
7.权利要求1的方法,还包括以下步骤:
在处理单元处,生成对应于由所述子集的一个或多个组块点确定 的数据组块的数据组块尺寸的值,其中所生成的该值表示包含在所述 数据组块中的底层数据。
8.权利要求7的方法,还包括以下步骤:
在处理单元处,把所生成的该值与一个或多个先前生成的值进行 比较,以便确定所生成的该值是否等于所述一个或多个先前生成的值。
9.权利要求8的方法,还包括以下步骤:
在处理单元处,确定存在数据复制;以及
在处理单元处,停止对被确定为具有复制数据的数据组块中的数 据的进一步处理。
10.权利要求8的方法,还包括以下步骤:
如果没有数据复制,则由处理单元存储所生成的该值。
11.权利要求1的方法,还包括以下步骤:在处理单元处,把包含 在由所述第二内容定义的选择函数所选择的新数据窗或新数据组块中 的底层数据与来自一个或多个先前定义的数据窗或数据组块的先前遇 到的底层数据进行比较。
12.权利要求11的方法,还包括以下步骤:
如果包含在所述新数据窗中的底层数据不等于所述先前遇到的底 层数据,则由处理单元输出包含在所述新数据窗中的底层数据;以及
如果包含在所述新数据组块中的底层数据等于所述先前遇到的底 层数据,则不输出包含在所述新数据组块中的底层数据。
13.权利要求1的方法,还包括以下步骤:在处理单元处,生成对 应于数据窗或数据组块的值,该值表示包含在该数据窗或数据组块中 的底层数据。
14.权利要求13的方法,还包括以下步骤:在处理单元处,把所 生成的该值与一个或多个先前生成或遇到的值进行比较。
15.权利要求14的方法,还包括以下步骤:
如果所生成的该值不等于所述一个或多个先前生成或遇到的值, 则由处理单元输出所生成的该值;以及
如果所生成的该值等于所述一个或多个先前生成或遇到的值,则 不输出所生成的该值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国日本电气实验室公司,未经美国日本电气实验室公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780004129.8/1.html,转载请声明来源钻瓜专利网。





