[发明专利]基于GPU排序的MapReduce优化方法有效
申请号: | 201710026869.7 | 申请日: | 2017-01-15 |
公开(公告)号: | CN106802787B | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 李鹏飞;丁有伟;孙杰 | 申请(专利权)人: | 天泽信息产业股份有限公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F9/50 |
代理公司: | 南京中盟科创知识产权代理事务所(特殊普通合伙) 32279 | 代理人: | 孙丽君 |
地址: | 210019 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于GPU排序的MapReduce优化方法,其中MapReduce包含Map阶段、Shuffle阶段、以及Reduce阶段,Map阶段包含Spill过程和Merge过程,Reduce阶段包含Merge过程,其中,在Map阶段的Spill过程中采用基于GPU的快速排序流程,在Map阶段的Merge过程中和Reduce阶段的Merge过程中采用基于GPU的归并排序流程。通过以基于GPU的快速排序和归并排序算法替代传统的基于CPU的快速排序、归并排序和堆排序算法,提高中间数据处理速度,进而提升MapReduce的性能。 | ||
搜索关键词: | 基于 gpu 排序 mapreduce 优化 方法 | ||
【主权项】:
1.一种基于GPU排序的MapReduce优化方法,其中:MapReduce包含:Map阶段、Shuffle阶段、以及Reduce阶段,所述Map阶段包含Spill过程和Merge过程,所述Reduce阶段包含Merge过程,其特征在于,在所述Map阶段的Spill过程中采用基于GPU的快速排序流程,在所述Map阶段的Merge过程中和Reduce阶段的Merge过程中采用基于GPU的归并排序流程,其中:所述基于GPU的快速排序流程包含步骤:(1.1)将数据存入GPU的全局存储空间,并划分成m个互不重叠的数据块,每个数据块由一个线程块处理,共有m个线程块;(1.2)所述m个线程块并行地遍历对应的数据块,每个线程块内部n个线程并行地遍历相应数据块的一部分,并记录大于和小于分界值的元素的个数;(1.3)依次统计每个线程块内部的每个线程的相对计数值;(1.4)依次统计每个线程块的计数值和相对计数值;(1.5)所有线程进行数据交换,序列分成大于分界值和小于分界值的两个子序列:子序列1、子序列2;(1.6)对步骤(1.5)中产生的所述子序列1、所述子序列2分别再采用步骤(1.1)‑(1.5)进行排序,直到最终排序完成,即可实现对原始序列的排序,所述基于GPU的归并排序流程包含步骤:(2.1)将待归并的序列两两分组,分成h组,每组序列包含Ai和Bi两个序列,每次对一组序列Ai和Bi进行归并,其中1≤i≤h,Ai和Bi表示第i个分组包含的两个序列;(2.2)分别将Ai和Bi划分成m个子序列,每个线程块对Ai的一个子序列和Bi的一个子序列进行归并,共需进行log2 m+1轮子序列的归并即可将序列Ai和Bi归并为一个有序序列Ci;(2.3)重复步骤(2.2),直到所有分组的序列Ai和Bi归并完成,分别产生每个分组的归并结果C1、C2、……、Ch;其中1≤i≤h,Ai和Bi表示第i个分组包含的两个序列,Ci为Ai和Bi归并完成后产生的有序序列;(2.4)对h个分组的归并结果C1、C2、……、Ch,重复步骤(2.1)‑(2.3)进行归并,直到产生最终归并结果,在步骤(1.3)中,线程块Bk中的每个线程的计数值分别为Lk,1,...,Lk,n和Rk,1,...,Rk,n,则第i个线程的相对计数值分别为:
和
其中Lk,1和Rk,1分别表示线程块Bk中第1个线程遍历的数据中比分界值小的数据个数和比分界值大的数据个数,Lk,n和Rk,n分别表示线程块Bk中第n个线程遍历的数据中比分界值小的数据个数和比分界值大的数据个数,Lk,j和Rk,j分别表示线程块Bk中第j个线程遍历的数据中比分界值小的数据个数和比分界值大的数据个数,BLk,i和BRk,i分别表示线程块Bk中第i个线程的相对计数值,即该线程块中前i‑1个线程遍历的数据中比分界值小的数据总量和比分界值大的数据总量,在步骤(1.4)中,线程块Bk的计数值分别为
和
线程块Bk的相对计数值分别为:
和
其中Lk、Lj和Rk、Rj分别表示线程块Bk和Bj遍历的数据块内小于分界值的数据总量和大于分界值的数据总量,SLk和SRk分别表示线程块Bk之前的k‑1个线程块遍历的数据块中小于分界值的数据总量和大于分界值的数据总量,在以上公式中,1≤k≤m、1≤i≤n。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天泽信息产业股份有限公司,未经天泽信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710026869.7/,转载请声明来源钻瓜专利网。