[发明专利]一种基于深度强化学习的数据中心资源离线调度方法在审
申请号: | 201711399661.6 | 申请日: | 2017-12-22 |
公开(公告)号: | CN109960578A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 田文洪;叶宇飞;王金;黄文强 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及计算机技术领域,特别涉及一种基于深度强化学习的数据中心资源离线调度方法。深度强化学习可以为资源调度管理的人为启发式方法提供一个可行的替代方案。通过不断学习,深度强化学习方法可以针对特定工作负载(例如周期性负载或随机负载)进行优化,并在各种条件下保持高质量优化调度结果。把最小化平均作业slowdown(系统减缓时间)作为优化目标,通过计算离线调度中每一次调度的奖励值,引导深度网络向着目标优化,最终向着最优目标训练。结果显示,在本发明的大量实施例测试中,使用深度强化学习的离线调度方法的slowndown远低于SJF(最短作业优先算法)等传统的优化作业调度方法,体现出深度强化学习方法在这一领域的优势。 | ||
搜索关键词: | 强化学习 离线 调度 数据中心资源 计算机技术领域 资源调度管理 周期性负载 调度结果 工作负载 目标训练 目标优化 随机负载 优化目标 质量优化 作业调度 传统的 启发式 最小化 算法 优化 测试 替代 奖励 网络 学习 | ||
【主权项】:
1.一种基于深度强化学习的数据中心资源离线调度方法,其特征在于,所述数据中心资源离线调度系统包括:数据源模块,用于生成离线调度作业的数据,数据包括作业的所需资源类型(例如,CPU,内存,I/O)、作业的所需资源大小、离线作业的总体数量;运行环境模块,用于构建运行环境模型,所述运行环境包含分配的群集资源Cluster、等待作业槽JobSlot。运行环境模块中的所有部分都以单元格的图像表示出来;评价机制学习模块,用于将获得的信息结合评价机制得到所需要的奖赏函数,奖赏函数作为反馈输送至控制策略学习模块,进行优化网络参数;控制策略学习模块,用于深度强化学习方法的优化策略学习,通过得到的奖赏函数从而用于指导之后的离线作业调度序列,并通过策略更新神经网络参数,得到所述资源离线调度作业最终的实际操纵策略。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于田文洪;叶宇飞;王金;黄文强,未经田文洪;叶宇飞;王金;黄文强许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711399661.6/,转载请声明来源钻瓜专利网。