[发明专利]基于可扩展学习索引的空间范围查询方法在审
申请号: | 202010891714.1 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112035586A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 许建秋;王宁 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 扩展 学习 索引 空间 范围 查询 方法 | ||
本发明公开一种基于可扩展学习索引的空间范围查询方法,包括如下步骤:1)数据预处理:将空间对象按坐标的Hilbert编码值排序,提取每条数据的Hilbert编码值和数据所在的位置作为训练数据;2)构建可扩展多层空间学习索引,训练多层模型,学习空间对象的数据分布,增加缓存区,用于数据的插入更新操作;3)基于可扩展多层学习索引的空间范围查询操作;数据按照Hilbert编码值排序后,按照Hilbert曲线的特性,将查询范围划分为多个子区域,对每个子区域,通过多层学习索引预测数据所在的位置,遍历对应的缓存区,查找落在查询范围内的数据。本发明将机器学习和空间填充曲线融入到空间索引中,并根据数据分布规律设计有效的空间范围查询方法。
技术领域
本发明属于计算机软件开发领域,具体涉及一种通过可扩展的空间学习索引进行范围查询的方法。
背景技术
随着基于位置服务的普及、空间信息基础设施建设和空间数据获取技术的快速发展,空间对象的搜索和查询要求越来越高。由于空间索引性能直接影响空间数据库和地理信息系统的整体性能,因此在依靠硬件来提高数据库系统性能的同时,提高空间索引的效率始终是研究的热点。目前各种索引结构被设计出来并且有着不同的应用。
近年来,大数据、机器学习、人工智能等技术飞速发展,数据技术也发生了巨大的变化。机器学习在数据质量管理和数据分析中起着重要作用,也在数据技术中展现出其独特的优势。神经网络在学习数据方面展现出优异的性能。
对于现有的各种空间索引结构,每种都有其自身的优缺点,但基本原理是相似的,即采用分割的方法,自顶向下、逐级划分地理空间,从而形成树状空间索引结构。传统索引没有考虑数据的分布特性,通常会事先假设最差的数据分布,因此期望索引具有更高的通用性。
空间查询是指利用空间索引机制,从数据库中找到符合查询条件的空间对象。范围查询是给定查询范围,查找落在查询范围内的空间对象。范围查询是使用空间索引最常用的空间查询之一。常见的索引如R-tree、四叉树等树形索引在进行范围查询时,是通过访问索引的根结点并递归地检索与查询区域相交的子结点来处理范围查询。如果数据集大,树的深度过大,会导致磁盘I/O操作过于频繁,进而导致查询效率低下。
发明内容
发明目的:本发明目的在于针对现有技术的不足,发明了一种可以学习空间数据分布并且灵活可扩展的空间索引和基于此索引的空间范围查询方法。将机器学习和Hilbert空间填充曲线应用于空间索引和范围查询中,以提高索引效率、减小索引文件大小、提高数据查询速度。
技术方案:本发明所述基于可扩展学习索引的空间范围查询方法,包括如下步骤:
1)数据预处理:将原始数据按照坐标的Hilbert编码值排序,将排序后的数据位置和Hilbert编码值作为训练数据;
2)构建并训练可扩展的多层学习索引:构建多层学习模型,多层模型包含多个层,每个层包含多个神经网络模型,每个底层模型包含一个缓存区用于进行数据的插入更新等操作,将步骤1中的训练数据输入多层模型进行训练;
3)基于Hilbert曲线分割的范围查询:根据Hilbert曲线的分布规律,对查询范围进行分割,计算分割后子区域Hilbert值的最大值和最小值,将其输入多层模型中预测数据所在位置,同时搜索对应底层模型的缓存区,选择Hilbert值在范围内的数据。
有益效果:
1)创新地将机器学习和Hilbert空间填充曲线应用于空间数据的索引上,通过构建多层学习模型有效提高索引效率、减小索引文件空间开销,并且为每个底层模型增加缓存区使得索引灵活可扩充。
2)基于Hilbert曲线的分布规律,对每个查询范围进行不同大小的分割,有效地减少了范围查询需要搜索的数据规模,提高范围查询效率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010891714.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电力预案文本序列标注中集外词处理方法
- 下一篇:AVS调压电路和装置