[发明专利]一种基于机器学习的多核下MPI最优运行时的参数预测方法有效
申请号: | 201210042043.7 | 申请日: | 2012-02-23 |
公开(公告)号: | CN102708404A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 曾宇 | 申请(专利权)人: | 北京市计算中心 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100012 北京市朝阳区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 多核 mpi 最优 运行 参数 预测 方法 | ||
1.一种基于机器学习的多核下MPI最优运行时的参数预测方法,其特征在于:
采用决策树和人工神经网络两种标准构建优化模型;
用构造的训练基准在目标多核机群上通过设置多组运行时的参数的组合生成训练数据,并对构造的模型进行离线训练;
训练后的模型用于对新的MPI程序预测最优的运行时的配置参数;
将预测所得结果与实际最有运行时参数向量做对比,评估预测模式的准确度。
2.如权利要求1所述的方法,其特征在于:所述决策树模型将训练基准的程序特征和运行时参数的配置组合作为决策树模型的输入,训练数据为:{Fi,Ci},其中Fi为训练基准的程序特性,Ci为当前程序特征下的运行时参数组合,实际得到的加速比作为决策树的输出。
3.如权利要求1所述的方法,其特征在于:所述人工神经网络模型将训练基准中产生最高加速比的数据选出用来训练参数预测模型,训练数据为:{Fi,Ci_best},其中Fi=<f1,f2,...,fm>为训练基准的程序特性,Ci_best=<c1,c2,...,cn>为当前程序特征下的最佳运行时参数组合。
4.如权利要求2所述的方法,其特征在于:所述决策树模型在训练模型阶段,通过变换向量F与C产生不同的加速比结果;运用模型进行预测时,若Fp代表输入的MPI程序的程序特征向量,则能得到最大加速比Smax的运行时参数配置Cbest将是此MPI程序的最佳运行时参数组合向量,即Smax=MREPTree(Fp,Cbest)。
5.如权利要求3所述的方法,其特征在于:所述人工神经网络模型在训练模型阶段,通过变换向量F与C产生不同的加速比结果;运用模型进行预测时,若MANN是训练后的人工神经网络模型,则Cbest=MANN(Fp),其中Fp代表输入的MPI程序的程序特征向量,Cbest是此MPI程序的最佳运行时参数组合向量。
6.如权利要求1所述的方法,其特征在于:所述训练基准包括两种MPI通信方式:同步的MPI点到点通信和MPI集合操作;训练基准接收5个参数,可以分别用来控制训练基准中点到点通信的比例、集合通信的比例、两个MPI进程同步点到点通信的消息的大小、集合通信中交换的消息大小以及通信器的大小。
7.如权利要求1所述的方法,其特征在于:所述离线训练通过变换训练基准的5个输入参数,控制点到点通信和集合通信的比例分别为:100%的点到点通信、100%的集合通信、50%的点到点通信及50%的集合通信,在三种不同通信比例下,分别变换点到点以及集合通信中消息大小以及MPI通信器的大小,并变换运行时参数的配置组合,共产生训练数据3000条,用来训练神经网络优化模型。
8.如权利要求1所述的方法,其特征在于:当预测模型建立并用大量的学习数据训练完毕后,就要根据实际需求来执行预测任务。
9.如权利要求1所述的方法,其特征在于:在执行预测前,需要在目标多核机群下对要预测MPI程序的进行一次instrument运行,以得到输入的MPI程序的特征向量Fp;将Fp作为模型的输入即可得到输入MPI程序的最佳运行时参数组合;当目标多核机群发生变化时,以上过程需要重复进行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市计算中心,未经北京市计算中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210042043.7/1.html,转载请声明来源钻瓜专利网。