[发明专利]稀疏索引的建立方法和装置、稀疏索引及查询方法和装置在审

专利信息
申请号: 201110347637.4 申请日: 2011-11-07
公开(公告)号: CN103092885A 公开(公告)日: 2013-05-08
发明(设计)人: 周大;钱岭;郭磊涛;齐骥 申请(专利权)人: 中国移动通信集团公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 谢安昆;宋志强
地址: 100032 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 稀疏 索引 建立 方法 装置 查询
【权利要求书】:

1.一种稀疏索引的建立方法,其特征在于,包括:

针对每个待处理的数据记录,分别利用同一散列函数计算其键值的散列值,并根据计算出的散列值将该数据记录保存到对应的分区中,保存到同一分区中的数据记录具有相同的散列值;

对于任一分区,初始阶段,其中的内容为空,当所保存的数据记录达到预定要求时,利用所保存的数据记录组成一个文件块,当所保存的未组成文件块的数据记录再次达到预定要求时,利用未组成文件块的数据记录组成另一个文件块,依次类推;每组成一个文件块,则为该文件块建立一个索引项。

2.根据权利要求1所述的方法,其特征在于,该方法进一步包括:对于任一分区,当不再有新的数据记录需要保存,但所保存的未组成文件块的数据记录未达到预定要求时,利用未组成文件块的数据记录组成一个文件块。

3.根据权利要求1或2所述的方法,其特征在于,所述达到预定要求包括:达到预定个数。

4.根据权利要求1所述的方法,其特征在于,

每个分区分别具有一个不同于其它分区的编号,每个文件块分别具有一个不同于同一分区中的其它文件块的编号;

每个索引项中分别包括:最大键值、最小键值、分区号、文件块号和散列函数名;其中,

最大键值是指该索引项对应的文件块中的各数据记录的键值中的最大值;

最小键值是指该索引项对应的文件块中的各数据记录的键值中的最小值;

分区号是指该索引项对应的文件块所属的分区的编号;

文件块号是指该索引项对应的文件块的编号;

散列函数名是指计算散列值时所使用的散列函数的名称。

5.根据权利要求4所述的方法,其特征在于,当所述稀疏索引建立完毕之后,进一步包括:

接收待查询键值,并从各索引项中查找出最小键值小于或等于待查询键值且最大键值大于或等于待查询键值的索引项,将查找出的索引项作为候选索引项;

针对每个候选索引项,分别利用其中的散列函数名对应的散列函数计算待查询键值的散列值以及该候选索引项中的最小键值或最大键值的散列值,如果待查询键值的散列值等于该候选索引项中的最小键值或最大键值的散列值,则将该候选索引项作为结果索引项;

遍历各结果索引项对应的文件块中的各数据记录,得到待查询键值对应的数据记录。

6.一种稀疏索引的建立装置,其特征在于,包括:

计算模块,用于针对每个待处理的数据记录,分别利用同一散列函数计算其键值的散列值,并将该数据记录及计算出的散列值发送给建立模块;

所述建立模块,用于根据接收到的散列值将接收到的数据记录保存到对应的分区中,保存到同一分区中的数据记录具有相同的散列值;对于任一分区,初始阶段,其中的内容为空,当所保存的数据记录达到预定要求时,利用所保存的数据记录组成一个文件块,当所保存的未组成文件块的数据记录再次达到预定要求时,利用未组成文件块的数据记录组成另一个文件块,依次类推;每组成一个文件块,则为该文件块建立一个索引项。

7.根据权利要求6所述的装置,其特征在于,所述建立模块进一步用于,对于任一分区,当不再有新的数据记录需要保存,但所保存的未组成文件块的数据记录未达到预定要求时,利用未组成文件块的数据记录组成一个文件块。

8.根据权利要求6或7所述的装置,其特征在于,所述达到预定要求包括:达到预定个数。

9.根据权利要求6所述的装置,其特征在于,

每个分区分别具有一个不同于其它分区的编号,每个文件块分别具有一个不同于同一分区中的其它文件块的编号;

每个索引项中分别包括:最大键值、最小键值、分区号、文件块号和散列函数名;其中,

最大键值是指该索引项对应的文件块中的各数据记录的键值中的最大值;

最小键值是指该索引项对应的文件块中的各数据记录的键值中的最小值;

分区号是指该索引项对应的文件块所属的分区的编号;

文件块号是指该索引项对应的文件块的编号;

散列函数名是指计算散列值时所使用的散列函数的名称。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110347637.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top