[发明专利]一种处理地理文本Skyline查询的混合空间索引方法有效
申请号: | 201710961027.0 | 申请日: | 2017-10-12 |
公开(公告)号: | CN108052514B | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 郑吉平;张智明;张丝曼 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31 |
代理公司: | 盐城市大丰区丰晟知识产权代理事务所(特殊普通合伙) 32454 | 代理人: | 葛潇敏 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理 地理 文本 skyline 查询 混合 空间 索引 方法 | ||
1.一种处理地理文本Skyline查询的混合空间索引方法,其特征在于:所述地理文本Skyline查询包括以下内容:
首先Skyline查询是依据数据点之间定义好的支配策略从整个数据集合中找出若干个数据点,这些数据点都满足一个条件,即在除去自身之外的整个数据集中,不存在任何的数据点支配该数据点,这些不被支配的数据点就构成了Skyline查询的结果集合;处理地理文本Skyline查询步骤如下:
步骤S1:输入查询点的空间地理位置和查询关键词集合;
步骤S2:基于深度优先遍历策略遍历IMR*-T树,对于当前遍历到的节点N,首先将节点N与其所有的左兄弟节点进行框架属性的比较,即对MBR以及文本相似度信息进行比较,若在N的左兄弟节点集合中存在一节点N’,满足如下关系:
N’.Xmax=N.XminN’.Ymax=N.YminN’.LBtext=N.UBtext
则称为N’支配N,且N中包含的所有的数据点都可以直接从整个数据集合中裁剪掉,即以N为根节点的子树都不需要再往下进行遍历,此时直接开始从N的右相邻兄弟节点开始继续遍历;
步骤S3:当遍历到叶子节点N,且N的左兄弟节点集合中不存在节点满足步骤S2中的支配条件,则逐个开始遍历N中的每一个数据点;
步骤S4:继续步骤S3中的操作,将当前遍历到的数据点e与当前状态下的Skyline结果集合中的数据点进行比较,在比较的过程中对Skyline结果集合进行更新和维护;
步骤S5:当遍历完IMR*-T树中所有的数据点之后,则查询完毕,并输出数据点的结果集合;
其中,IMR*-T树构造的具体步骤如下所示:
步骤一、首先基于数据集中各个数据点的地理空间位置分布,利用传统R*树的构造方法,即遍历数据集中的数据点并进行插入操作,以对索引树进行构造,直到所有的数据点都被插入到索引树中,则索引树的主体架构构造完毕;
步骤二、为步骤一中构造的索引树的每一个叶子节点构造一个Inverted File,该Inverted File中存储对应叶子节点中包含的所有数据点的关键词文本信息,并且该Inverted File与叶子节点之间是一一对应的关系,因此在两者之间构造了一个由叶子节点指向Inverted File的指针;
步骤三、在步骤一和步骤二构造的索引结构基础上,从叶子节点层逐层往上,为每一个索引节点添加该节点中存储的所有数据点的框架属性信息,包括最小边界矩形和关键词文本相似度信息,以及指向该节点左兄弟节点的横向指针;
步骤四、在建立好的IMR*-T树的基础上,通过遍历该IMR*-T树,以应答用户的Skyline查询请求,并返回Skyline结果。
2.如权利要求1所述的一种处理地理文本Skyline查询的混合空间索引方法,其特征在于,依照数据点的空间位置分布构造R*树时包括:
遍历整个数据集合按照R*树的构造策略将所有的数据点插入到IMR*-T树中,再将数据点插入到IMR*-T树的过程中会依据不同的情况采用不同的策略进行相应的处理;假设当前遍历到的待插入数据点为e,首先采用Choose Path策略选择合适的插入路径,并将数据点e插入到相应的叶子节点中;插入新的数据点之后,可能会出现叶子节点溢出的情况,而所谓的节点溢出是指节点中包含的对象数量超出了某一阈值φ,这个阈值是初始定义的一个索引树节点中所能包含对象数量的一个上限值,此时采用Pick Irrelevant策略选择该溢出节点中对所在MBR影响最小的那些节点进行重插入,重插入过程和上述数据点e的插入过程相同;当进行完重插入步骤之后,IMR*-T树中可能依旧存在叶子节点处于溢出的状态,此时按照自底向上和自左向右的顺序依次处理处于溢出状态的节点,在处理这些节点时有两种情况:(1)若当前溢出节点所在层在之前处理过程中已经采用过Pick Irrelevant重插入策略去解决溢出节点的溢出问题,那么此时采用Node Split策略对溢出节点进行分裂处理;(2)若当前溢出节点所在层在之前处理过程中未采用过Pick Irrelevant数据点重插入策略,则对当前溢出节点调用Pick Irrelevant策略进行重插入处理;最后直到IMR*-T树中不存在节点溢出现象,则数据点e插入成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710961027.0/1.html,转载请声明来源钻瓜专利网。