[发明专利]MapReduce性能优化系统及优化方法有效
申请号: | 201610586980.7 | 申请日: | 2016-07-21 |
公开(公告)号: | CN106250233B | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 姜进磊;武永卫;王博 | 申请(专利权)人: | 浙江清华长三角研究院 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 314001 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种MapReduce性能优化系统及方法,其中,系统包括:Skew‑‑主节点,用于作为主协调器全局地对Reduce子任务间的Key分布进行管理,并且将Reduce子任务调度到合适的执行节点上;多个Skew‑‑从节点,每个Skew‑‑从节点包括:Key监控器与IO监控器,用于收集Key相关的信息,并将Key相关的信息发送至Skew‑‑主节点。该优化系统可以优化MapReduce在倾斜数据上的性能,简单易实现。 | ||
搜索关键词: | mapreduce 性能 优化 系统 方法 | ||
【主权项】:
一种MapReduce性能优化系统,其特征在于,包括:Skew‑‑主节点,用于作为主协调器全局地对Reduce子任务间的Key分布进行管理,并且将所述Reduce子任务调度到合适的执行节点上,其中,所述Skew‑‑主节点包括:Key分配器,用于根据Reduce任务的复杂度将Keys均匀地分配到每一个Reduce子任务上;Reducer选择器,用于根据Key的位置信息把所述Reduce子任务调度到所述合适的执行节点上;多个Skew‑‑从节点,所述多个Skew‑‑从节点位于Hadoop YARN的节点管理器上,所述多个Skew‑‑从节点中每个Skew‑‑从节点包括:Key监控器与IO监控器,用于收集Key相关的信息,所述Key相关的信息包括group大小、所述Key的位置信息以及每个节点的IO占用信息,并将所述Key相关的信息发送至所述Skew‑‑主节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江清华长三角研究院,未经浙江清华长三角研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610586980.7/,转载请声明来源钻瓜专利网。