[发明专利]基于增量式分区策略的MapReduce数据均衡方法有效

专利信息
申请号: 201610480210.4 申请日: 2016-06-27
公开(公告)号: CN106126343B 公开(公告)日: 2020-04-03
发明(设计)人: 陈群;房超;王卓 申请(专利权)人: 西北工业大学
主分类号: G06F9/50 分类号: G06F9/50;G06F16/182;G06F3/06
代理公司: 西北工业大学专利中心 61204 代理人: 王鲜凯
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了基于增量式分区策略的MapReduce数据均衡方法。具体为首先在Map端产生多于Reducer个数的微分区,微分区的负载统计被持续收集并且发送给决策者,在每一个决策点,优化的马尔科夫模型在未被分配的微分区中自动进行分区选择,然后利用分配算法将选中的微分区分配到各Reducer上;依照此方法,经过多次分区选择和分配,最终在执行Reduce函数前,将所有微分区分配到Reduce端,该方法使得数据划分更加均衡,有效避免了数据倾斜所带来的负载不均衡问题。
搜索关键词: 基于 增量 分区 策略 mapreduce 数据 均衡 方法
【主权项】:
一种基于增量式分区策略的MapReduce数据均衡方法,其特征在于步骤如下:步骤1:确定一系列的决策点,在每一个决策点t使用优化的马尔科夫决策模型(S,A,P,Rat(st,st+1),γ)对在Map端产生的N个微分区进行自动分区,其中N>M,M为Reducer个数;决策点的确定:以第一个Mapper完成时刻为第一个决策点,运行到最后一个Mapper的α时刻为最后一个决策点,中间的决策点采用等分原则;所述的马尔科夫决策模型(S,A,P,Rat(st,st+1),γ):S是状态的有限集,A是行动的有限集,行动是自动选择前k个微分区,P是状态转换概率的集合,γ是代表现在和将来报酬拥有不同的重要性的折扣因素,为报酬函数;其中W是微分区的总量,是在决策点t已分配的微分区的总量,N是微分区的总个数,是在决策点t以后未分配的微分区的总个数;步骤2:采用LPT算法对步骤1中的分区进行分配,将并行代价的目标函数的作为LPT算法的输出:所述的并行代价的目标函数:<mrow><mi>min</mi><munder><mrow><mi>m</mi><mi>a</mi><mi>x</mi></mrow><mi>j</mi></munder><mo>{</mo><msubsup><mi>L</mi><mi>j</mi><mi>f</mi></msubsup><mo>}</mo></mrow><mfenced open = "" close = ""><mtable><mtr><mtd><mrow><mi>s</mi><mo>.</mo><mi>t</mi><mo>.</mo></mrow></mtd><mtd><mrow><mo>(</mo><mn>1</mn><mo>)</mo><mo>-</mo><mo>-</mo><mo>-</mo><mo>&ForAll;</mo><mn>1</mn><mo>&le;</mo><mi>i</mi><mo>&le;</mo><mi>h</mi><mo>,</mo><munder><mo>&Sigma;</mo><mrow><mn>1</mn><mo>&le;</mo><mi>j</mi><mo>&le;</mo><mi>M</mi></mrow></munder><msub><mi>x</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mn>1</mn></mrow></mtd><mtd><mrow><mo>(</mo><mn>2</mn><mo>)</mo><mo>-</mo><mo>-</mo><mo>-</mo><mo>&ForAll;</mo><mn>1</mn><mo>&le;</mo><mi>i</mi><mo>&le;</mo><mi>M</mi><mo>,</mo><msub><mi>L</mi><mi>j</mi></msub><mo>=</mo><msub><mi>L</mi><mi>j</mi></msub><mo>+</mo><munder><mo>&Sigma;</mo><mi>i</mi></munder><mo>(</mo><msub><mi>x</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>&CenterDot;</mo><msubsup><mi>e</mi><mi>i</mi><mi>c</mi></msubsup><mo>)</mo></mrow></mtd></mtr></mtable></mfenced>其中,Lj为给第j个Reducer分配的初始负载,为第j个Reducer被分配微分区后的负载,h为在决策点t之前未被分配的微分区总个数,xij为Pu中的微分区到Reducer的映射,Pu为在决策点t之前未被分配的微分区集合,如果第i个微分区被分配到第j个Reducer则xij=1,否则xij=0;指在Pu中第i个微分区预估的数量,指被分配到第j个Reducer上的微分区的总量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610480210.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top