[发明专利]MapReduce应用的相关参数的配置方法和装置在审
| 申请号: | 201410373376.7 | 申请日: | 2014-07-31 |
| 公开(公告)号: | CN105302536A | 公开(公告)日: | 2016-02-03 |
| 发明(设计)人: | 邹嘉;史巨伟;郑勇;王晨;刘杰 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F9/44 | 分类号: | G06F9/44 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;陈颖 |
| 地址: | 美国纽*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | mapreduce 应用 相关 参数 配置 方法 装置 | ||
1.一种基于分布式文件系统的MapReduce应用的相关参数的配置方法,包括:
接收第一MapReduce作业的处理请求;
获取历史MapReduce作业的作业特征属性;
从所述历史MapReduce作业的作业特征属性中查找到与所述第一MapReduce作业相关的第二MapReduce作业的作业特征属性;
根据所述第二MapReduce作业的作业特征属性配置所述第一MapReduce作业的相关参数。
2.根据权利要求1所述的方法,其中所述历史MapReduce作业的作业特征属性包括历史MapReduce作业的作业名称和以下中的至少一个:输入文件的路径、输入文件的大小、输出文件的路径、输出文件的大小、Map任务数和Reduce任务数。
3.根据权利要求1所述的方法,如果所述第一MapReduce作业是数据生成类型,则从所述历史MapReduce作业的作业特征属性中查找与所述第一MapReduce作业相关的第二MapReduce作业进一步包括:
从所述历史MapReduce作业的作业特征属性中查找到与所述第一MapReduce作业相似的第三MapReduce作业;
从历史MapReduce作业的作业特征属性中查找到以所述第三MapReduce的输出文件作为输入文件的第二MapReduce作业。
4.根据权利要求1所述的方法,如果所述第一MapReduce作业是数据消费类型,
则从所述历史MapReduce作业的作业特征属性中查找到与所述第一MapReduce作业相关的第二MapReduce作业进一步包括:
从所述历史MapReduce作业的作业特征属性中查找到与所述第一MapReduce作业相似的第二MapReduce作业。
5.根据权利要求3或4所述的方法,其中根据所述第二MapReduce作业的作业特征属性配置所述第一MapReduce作业的相关参数进一步包括:
根据所述第二MapReduce作业的输入文件的分片大小划分所述第一MapReduce作业的输入文件的数据块大小。
6.根据权利要求5所述的方法,其中根据所述第二MapReduce作业的输入文件的分片大小划分所述第一MapReduce作业的输入文件的数据块大小包括:将所述第一MapReduce作业的输入文件的数据块大小配置为所述第二MapReduce作业的输入数据分片大小的整数倍。
7.根据权利要求6所述的方法,其中根据所述第二MapReduce作业的作业特征属性配置所述第一MapReduce作业的相关参数进一步包括:
根据所述第二MapReduce作业的输入文件的分片大小确定所述第一MapReduce作业的Map任务数或Reduce任务数。
8.根据权利要求7所述的方法,其中根据所述第二MapReduce作业的输入文件的分片大小确定所述第一MapReduce作业的Map任务数或Reduce任务数进一步包括:
获取处理所述第一MapReduce作业的计算节点数和对应于每个计算节点的资源槽的数目;
将所述第一MapReduce作业的Map任务数或Reduce任务数配置为所有计算节点的资源槽的总数的整数倍。
9.根据权利要求3所述的方法,其中从所述历史MapReduce作业的作业特征属性中查找到与所述第一MapReduce作业相似的第三MapReduce作业包括:
以所述第一MapReduce作业的作业名称作为关键字在所述历史MapReduce作业的作业特征属性中进行查找;
响应于查找到一个与所述第一MapReduce作业具有相同作业名称的历史MapReduce作业,则确定该历史MapReduce作业为所述第三MapReduce作业;
响应于查找到多个具有相同作业名的历史MapReduce作业,则根据以下的至少之一确定与第一MapReduce作业相似的第三MapReduce作业:输出文件的路径、输出文件的大小和计算节点数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410373376.7/1.html,转载请声明来源钻瓜专利网。





