[发明专利]应用于电子地图的空间关键字查询的准确搜索方法在审
申请号: | 201910333876.0 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110059148A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 姚斌;阮珂;徐阳;过敏意;陈全;李超;沈耀;冷静文;郑文立;林昊 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/22;G06F16/245 |
代理公司: | 上海市汇业律师事务所 31325 | 代理人: | 王函 |
地址: | 200030 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 布隆过滤器 子项 空间关键字 电子地图 词汇表 查询 搜索 非叶子节点 索引效率 系统资源 叶子节点 初始化 父节点 根节点 数据集 子节点 索引 映射 应用 指向 集合 容纳 节约 | ||
本发明公开了一种应用于电子地图的空间关键字查询的准确搜索方法,其包括如下步骤:S1,基于数据集首先构建叶子节点u:设u中包含的点的集合为up,将各关键字t映射到包含t的对象列表来构建u的倒排列表,并收集u的词汇表构建父节点的布隆过滤器;S2,构建非叶子节点p:设p的子项为{c1,…,cf},所述f为一个节点最大能容纳的子项数目,将p的各个子项指向的子节点构成节点p的词汇表,并对各关键字插入初始化的布隆过滤器;S3,构建根节点、完成基于布隆过滤器的IR‑tree的构建;S4,构建S3所得IR‑tree的查询索引。本发明能够提升其对关键字的索引效率,节约系统资源。
技术领域
本发明属于定位技术领域,具体来说涉及一种应用于Spark平台上的应用于电子地图的空间关键字查询的准确搜索方法。
背景技术
近年来随着通信技术的发展和移动终端的广泛使用,基于位置的社会服务层出不穷。空间关键字查询是以用户的地理位置信息和多个查询关键字作为参数,返回和这些参数有着空间和文本相关度的空间对象。在一个查询中,构建有效的索引结构,可以极大地提高查询效率。对于一个空间中的索引,是指将对象的位置信息,大小形状等按照一定结构排列的一种数据结构。近似空间关键字查询的最先进的解决方案都是基于空间优先的索引结构,这种方案存在的问题是,一般的空间文本对象都会有至少数十个关键字。而基于空间优先的结构在对平均具有数十个关键字的空间文本对象进行索引优化时非常低效。因此,如何开发出一种新型的空间关键字查询的准确搜索方法,能够在空间关键字查询过程中提升其对关键字的索引效率,节约系统资源,是本领域技术人员需要研究的方向。以下为本申请中所涉及的字母缩写的注释:R-tree:B-tree向多维空间发展的另一种形式,它将空间对象按范围划分,每个结点都对应一个区域和一个磁盘页,非叶结点的磁盘页中存储其所有子结点的区域范围,非叶结点的所有子结点的区域都落在它的区域范围之内。IR-tree:以倒排索引和R-tree索引为基础,通过倒排索引解决文本相似度的计算模型。BFIR-tree:基于海量数据处理实现的IR-tree;CBFIR-tree:动态的BFIR-tree;S2I-V结构:对不同频率的关键字应被区别处理的模型结构;eBRQ:基于关键字包含的范围查询;aBRQ:基于近似关键字包含的k最近邻查询;falsepositive:误检率;。KNN算法:即临近算法,是数据挖掘分类技术中最简单的方法之一。I-Node:一个叶子R树节点,它存储了将每个关键字映射到空间关键字对象的倒排列表。
发明内容
本发明要解决的提供了一种应用于电子地图的空间关键字查询的准确搜索方法,能够提升其对关键字的索引效率,节约系统资源。
其采用的技术方案如下:
一种应用于电子地图的空间关键字查询的准确搜索方法,其包括如下步骤:S1,构建叶子节点u:设u中包含的点的集合为up,将各关键字t映射到包含t的对象列表来构建u的倒排列表,并收集u的词汇表构建父节点的布隆过滤器;S2,构建非叶子节点p:设p的子项为{c1,…,cf},所述f为一个节点最大能容纳的子项数目,将p的各个子项指向的子节点构成节点p的词汇表,并对各关键字插入初始化的布隆过滤器;S3,构建根节点、完成基于布隆过滤器的IR-tree的构建;S4,构建基于布隆过滤器的IR-Tree结构的查询索引。
优选的是,上述应用于电子地图的空间关键字查询的准确搜索方法中:步骤S4包括如下步骤:S41:S61:给定eBKQ查询公式为:eBKQ = {Qs=(τ,ε),Qt},所述Qs为空间条件,Qt为一组关键字,检查当前节点中Qs是否位于查询区域,若Qs位于查询区域内,则跳转至S23,若Qs不在查询区域中,则递归检查该节点的子节点;S42:检测Qt中的各关键字是否存在于该节点的布隆过滤器中,若否则剪枝该节点,若是则跳转至S43;S43:将各个关键字映射到其对应的记录列表,并对这些列表进行取交集操作,以获得最后的解集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910333876.0/2.html,转载请声明来源钻瓜专利网。