[发明专利]一种针对异构环境的基于Spark的自适应任务调度方法在审
| 申请号: | 201811179011.5 | 申请日: | 2018-10-10 |
| 公开(公告)号: | CN109376012A | 公开(公告)日: | 2019-02-22 |
| 发明(设计)人: | 孙麟;田玲;罗光春;刘贵松;陈君 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48;G06N3/00;G06N3/04;G06N3/08 |
| 代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自适应任务调度 动态调整 任务调度 任务执行 时间预测 异构环境 任务调度算法 调度 自适应调整 调度算法 模型开发 任务分配 任务迁移 任务数据 时间矩阵 数据采集 搜索调度 运行过程 综合考虑 采样 构建 搜索 进度 | ||
1.一种用于异构环境的基于Spark平台的自适应任务调度方法,其特征在于,包括以下步骤:
S1)数据采集:
采集Spark集群任务执行日志,所述任务执行日志由多条任务记录组成,每一条任务记录包含影响任务执行时间的变量值和实际执行时间;
S2)构建任务执行时间预测模型:
根据所述任务执行日志,生成训练数据集;
设置用于回归预测任务执行时间的径向基函数RBF神经网络的网络结构;
采用所述训练数据集对所设置的RBF神经网络进行深度学习训练,得到任务执行时间预测模型;
S3)任务调度处理:
S301:基于能调度的资源集和待调度任务集,根据所述任务执行时间预测模型生成任务-资源执行时间矩阵,所述任务-资源执行时间矩阵用于表征每个待调度任务在每个能调度的资源上的预测执行时间;
S302:采用基于粒子群优化PSO算法迭代搜索最优任务调度方案:
S302-1:将任务调度方案编码为粒子的位置信息,初始化粒子群;
S302-2:基于所述任务-资源执行时间矩阵计算每一个粒子对应的调度方案的的最后一个完成任务的资源的总执行时间,并将所述总执行时间的倒数作为每个粒子的适应度;所述总执行时间等于分配给所述最后一个完成任务的资源的所有任务的预测执行时间之和;
S302-3:基于当前每个粒子的适应度计算个体最优位置和粒子群的全局最优位置;
S302-4:判断是否满足预设的迭代搜索条件,若是,则将当前的全局最优位置作为PSO算法的迭代搜索结果;否则对每个粒子的速度和位置进行更新后,继续执行步骤S302-2。
2.据权利要求1所述的任务调度方法,其特征在于,所述步骤S302中,
粒子编码方式为:将任务调度方案编码为粒子的位置信息X=(x1,x2,...,xn),其中,所述粒子位置信息的维度等于待调度任务数n,维度d的值xd表示将待调度任务d调度到资源xd上执行,并且1≤xd≤m,m为资源集合大小,其中d=1,...,n;
粒子的位置更新公式为:xij(t+1)=round(xij(t)+υij(t+1)),其中t表示种群的第t代,i表示第i个粒子,j表示粒子的第j维,υij表示粒子i的维度j的速度,粒子速度的初始值为预设值,xij是粒子i的维度j的位置,函数round()用于计算输入参数四舍五入整数值。
3.据权利要求1所述的任务调度方法,其特征在于,所述步骤S1)中,采集Spark集群任务执行日志的方式为:通过在Spark源码中插入监听代码实现。
4.权利要求1所述的任务调度方法,其特征在于,所述步骤S2)中,设置RBF神经网络的网络结构具体包括以下步骤:
将所述训练数据集中的任务执行时间的变量值构成执行时间预测模型的输入向量,实际执行时间作为执行时间预测模型的目标变量;
所述RBF神经网络的输入层的神经元的个数为任务执行时间的变量值的个数,输出层的神经元的个数为1;中间隐藏层的神经元采用的激活函数为高斯函数其中,x为任务执行时间的变量值组成的输入向量,K为隐藏层神经元的个数,ωi为隐藏层第i个神经元输出的权重,ci和σi分别为隐藏层第i个神经元激活函数的中心点和宽度,b是偏置项。
5.根据权利要求4所述的任务调度方法,其特征在于,对RBF神经网络的深度学习训练具体为:
采用K-Means++算法确定隐藏层第i个神经元激活函数的中心点ci和宽度σi;
随机生成隐藏层第i个神经元输出的权重ωi;
采用梯度下降方法对参数ci、σi、ωi和b进行迭代调整,达到设定的迭代次数后,模型训练结束,得到任务执行时间预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811179011.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:虚拟化系统中管理资源的方法和装置
- 下一篇:负载均衡方法及装置





