[发明专利]基于Voronoi图的分布式时空索引方法在审
申请号: | 201710976133.6 | 申请日: | 2017-10-19 |
公开(公告)号: | CN107766495A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 季长清;汪祖民;刘艳;高杨;李泽宇 | 申请(专利权)人: | 大连大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 大连智高专利事务所(特殊普通合伙)21235 | 代理人: | 毕进 |
地址: | 116622 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 voronoi 分布式 时空 索引 方法 | ||
1.一种基于Voronoi图的分布式时空索引方法,其特征步骤如下:
使用Spark构建造倒排Voronoi索引,给定d维空间中两个数据集R和S,Spark按默认机制进行分片,部分mappers同时并行运行,在Spark任务中使用默认的reducer,在启动map函数之前,使用预聚类算法得到代表点p,并将其加载到每个map的主存中;
在每一个map处理进程中,依次利用TextInputFormat来读取输入的分片,TextInputFormat从文件读取数据到Mapper的实例中,分别计算数据集R中的每一个对象r,数据集S中的每一个对象s对象与代表点p点之间的距离,并将对象r,s分配给最接近的代表点P;R中具有m个对象r,一个对象r与任意对象s的最接近的代表点都被聚集在一个Voronoi单元格中,由此产成m个Voronoi单元格作为分区,输出<VCm,List(Pi)>对,给定查询点p,判别其最邻近的分区或最一些邻近的分区集,mapper输出原始数据集中的到最邻近的分区或最邻近的分区集的每一个对象r、s及其分区VCm的id;将mapper输出到Spark的文件系统。
2.如权利要求1所述的基于倒排泰森多边形的分布式时空索引方法,其特征在于:Voronoi图将一个空间划分为多个不相交的多边形,在每个多边形中的某一个点的最近邻均位于该点所在的Voronoi单元格内,图中的每个多边形称为与点p相关联的Voronoi单元格,点p所在的单元格内的任何点都是p的最近邻。
3.如权利要求1所述的基于倒排泰森多边形的分布式时空索引方法,其特征在于:倒排Voronoi索引包含两个部分:主索引,包括所有的聚类中心;第二索引,包括储存在每个分区VC的对像队列。
4.如权利要求1所述的基于倒排泰森多边形的分布式时空索引方法,其特征在于:代表点的获取方法,确定内部聚类点与相邻点,将内部聚类点的数据聚类,聚类后选出聚类中心进行索引,所需数据为与内部聚类点连接的相邻点,以这个内部聚类点为圆心,包含相邻的聚类中心点建立圆,以这个圆为外接圆的三角形作为Delaunay三角形,本方法中将两个不同的内部聚类点分别建立Delaunay三角形,这两个Delaunay三角形以相邻点为共同点建立Delaunay三角网,将数据对象分割为几个大分区,选择其中一聚类代表点成为代表点,被划分的每个对象以被聚类在一个Voronoi单元中,每个Voronoi网格中含有对象id。
5.如权利要求4所述的基于倒排泰森多边形的分布式时空索引方法,其特征在于:Voronoi图由VD(p)={V(p1),V(p2),...,V(pm)},其中:VD(p)是关于P的Voronoi图合集,V(p1)是p1的Voronoi图,给出的与所有的点相关联的集合,被称为p产生的遵循距离函数Dist()的Voronoi图,这里每个p点的Voronoi图一定包括比其他任何点更接近q的所有点,因而一个查询点q的近邻是闭合的Voronoi图;
Voronoi单元在空间R上,从D维空间中划分出一个包含n个点的区域,即P:{p1,p2,…,pn},分区VC给出的区域,即VC分区关于点pi的区域VC(pi),若满足VC(pi)=p|d(p,pi)≤(p,pj),则该区域被称为与p相关联的Voronoi单元;
其中:其中p是指定点或查询点,d(p,pi)是p和pi之间的最小欧氏距离,i、j是变量,n≥2,p1≠p2,i≠j,i,j∈In=1,..,n,且i取遍1,..,n中的所有值,每取一值时,j取遍1,..,n中除了此时的i取值的所有值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710976133.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冬笋红苕粉条及其加工生产方法
- 下一篇:方便粉丝生产系统