[发明专利]基于云计算的动态Skyline查询方法在审
申请号: | 201611150580.8 | 申请日: | 2016-12-14 |
公开(公告)号: | CN106599190A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 李媛媛;季长清;肖鹏;邓武;徐克圣 | 申请(专利权)人: | 大连交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 大连智高专利事务所(特殊普通合伙)21235 | 代理人: | 毕进 |
地址: | 116028 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 计算 动态 skyline 查询 方法 | ||
1.基于云计算的动态Skyline查询方法,其特征在于,包括如下步骤:
S1.建立基于数据分布密度的倒排网格索引,将数据区间分割成许多片段,以将数据空间分割成不等分的网格单元,然后映射每个数据点到网格单元中,利用MapReduce构建基于数据分布密度的倒排网格索引;当一个新的查询开始时,首先映射查询点到相应的网格单元中;
S2.进行全局Skyline格计算,整个计算流程是一个DAG图执行过程,得到的数据点作为动态Skyline计算的候选集,在动态Skyline计算中扫描候选集里的数据点,将数据点转换坐标,以将动态Skyline的计算转换成以查询点为坐标原点的静态Skyline计算,这个DAG执行过程启动一个基于Tez的MapReduce作业,利用Map函数在各节点中并行进行,结果进行缓存,接下来再启动一个MapReduce作业检查转换后数据点的Skyline格支配关系,进行Skyline的计算并返回结果。
2.如权利要求1所述的基于云计算的动态Skyline查询方法,其特征在于,步骤1中所述用MapReduce构建基于数据分布密度的倒排网格索引倒排网格索引的方法是:以<key,value>对形式存在,其具体格式由<ci,{pj,pk,...,pn}>所组成,每个节点利用Map函数,将自己节点内保存的数据分区里的数据转换成网格坐标,输出<key,value>对为<动态网格ID,数据点ID>,启动Reduce函数,对相同key值的value对进行归并,最终生成相同网格内的数据点有序列表,结果也是以<key,value>对形式保存,当MapReduce作业完成后,所有数据点被组织进网格结构中,生成动态倒排网格索引。
3.如权利要求1所述的基于云计算的动态Skyline查询方法,其特征在于,所述步骤S2中,查询点将d维数据空间分割成2d个象限,再调用全局Skyline格计算方法,轮询每个象限,计算查询点的全局Skyline格,得到粗粒度的Skyline候选点,将经过轮询计算之后的全局Skyline格中的数据作为候选集。
4.如权利要求3所述的基于云计算的动态Skyline查询方法,其特征在于,Skyline格支配关系的定义如下:假定在固定时间窗口中,一个d维的数据空间S={s1,s2,...,sd},数据集P={p1,p2,...,pn}是在数据空间S上的,给定查询点q,对于任意两个对象pi,pj∈P,pi动态支配pj即满足条件:
①
②
在时间窗口中,查询请求在不断地发生变化,如果当新的查询点到来,每个d维被查询对象pi会被映射成一个新的d′维空间的数据对象p′i=<f1(pi),f2(pi),...,fd′(pi)>,ft是与时间与维度相关的动态函数,令d′=d,对于给点查询点q,ft(pi)=|pi(t)-q(t)|,t表示数据对象的第t维。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连交通大学,未经大连交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611150580.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于云计算的动态Skyline查询装置
- 下一篇:用户属性分析方法及装置