[发明专利]为数据集合构建索引的方法、数据查询方法及计算设备有效
申请号: | 201911144368.4 | 申请日: | 2019-11-20 |
公开(公告)号: | CN110929103B | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 杨明哲 | 申请(专利权)人: | 车智互联(北京)科技有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;张赞 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 集合 构建 索引 方法 查询 计算 设备 | ||
本发明公开了一种为数据集合构建索引的方法、数据查询方法及计算设备,数据集合以有序单链表的形式存储在计算设备中,数据集合的各元素分别对应单链表的不同数据节点,为数据集合构建索引的方法包括:在单链表中插入多个虚节点、以将单链表划分为多个子链表,其中虚节点为子链表的起始节点;为多个虚节点建立数组索引、以便根据数组索引定位到子链表,其中数组索引的键为虚节点的节点值,值为虚节点的地址;为数据节点建立哈希索引、以便根据哈希索引定位到数据节点,其中哈希索引的键为数据节点的节点值,值为数据节点的地址。
技术领域
本发明涉及数据库领域,特别涉及一种为数据集合构建索引的方法、数据查询方法及计算设备。
背景技术
随着互联网的迅速发展,数据量的急剧增长,所包含的信息日益丰富,对数据的应用已经深入到生活和工作的方方面面,与此同时,对数据进行检索,得到期望的结果成为应用数据的一个重要方面。
目前,针对数据进行检索的主要方式是基于存储有序数据集合的单链表,通过多个逐层稀疏的单链表实现对有序数据集合的索引。一方面,由于在进行单点查询时,需要从顶层单链表开始索引到底层存储链表,导致索引平均时间较长,索引效率较低。另一方面,由于每一层索引链表中的结点及个数决定了索引的效率,为每一层链表增加结点并建立层之间的关联比较复杂,限制了索引效率的提升。如何使服务端尽快的查到符合条件的数据,往往是技术人员提升程序效率、服务方提高用户体验的关键。
为此,需要一种新的为数据集合构建索引的方法。
发明内容
为此,本发明提供一种为数据集合构建索引的方法,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供了一种为数据集合构建索引的方法,在计算设备中执行,数据集合以有序单链表的形式存储在计算设备中,数据集合的各元素分别对应单链表的不同数据节点,方法包括:在单链表中插入多个虚节点,以将单链表划分为多个子链表,其中虚节点为子链表的起始节点;为多个虚节点建立数组索引,以便根据数组索引定位到子链表,其中数组索引的键为虚节点的节点值、值为虚节点的地址;为数据节点建立哈希索引,以便根据哈希索引定位到数据节点,其中哈希索引的键为数据节点的节点值、值为数据节点的地址。
可选地,在根据本发明的为数据集合构建索引的方法中,在单链表中插入多个虚节点,以将单链表划分为多个子链表,包括:获取数据集合中数据的取值区间;将取值区间划分为多个等长度的子区间;分别将各子区间的起始值作为虚节点的节点值,插入到单链表中。
可选地,在根据本发明的为数据集合构建索引的方法中,若子区间的起始值为单链表中数据节点的节点值,则将该数据节点作为虚节点,并且将该虚节点的状态标记为有效。
可选地,在根据本发明的为数据集合构建索引的方法中,还包括:在预定的子链表中插入多个虚节点,以将该子链表划分为多个下级子链表;为该预定的子链表中的多个虚节点建立下级数组索引;将数组索引中该子链表对应的地址,更新为下级数组索引的地址。
可选地,在根据本发明的为数据集合构建索引的方法中,预定的子链表为多个子链表中、节点密度大于全局节点密度阈值的子链表;节点密度为子链表中有效节点数目除以该子链表的长度。
可选地,在根据本发明的为数据集合构建索引的方法中,还包括按照如下步骤在单链表中插入数据:获取待插入的目标数据;通过哈希索引确定目标数据是否在单链表中;若目标数据不在单链表中,则通过数组索引,确定目标数据对应的子链表;从子链表的起始节点开始,遍历单链表,查找第一个大于目标数据的数据节点,在该数据节点之前插入目标数据。
可选地,在根据本发明的为数据集合构建索引的方法中,还包括对单链表进行数据维护,数据维护包括删除数据,删除数据包括:通过哈希索引确定要删除值是否在单链表中;若要删除值在单链表中,则将要删除值对应的数据节点的状态修改为无效。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车智互联(北京)科技有限公司,未经车智互联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911144368.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置