[发明专利]一种基于深度强化学习的数据中心资源离线调度方法在审

申请号：	201711399661.6	申请日：	2017-12-22
公开（公告）号：	CN109960578A	公开（公告）日：	2019-07-02
发明（设计）人：	不公告发明人	申请（专利权）人：	田文洪;叶宇飞;王金;黄文强
主分类号：	G06F9/50	分类号：	G06F9/50
代理公司：	暂无信息	代理人：	暂无信息
地址：	610000 四川省成都***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及计算机技术领域，特别涉及一种基于深度强化学习的数据中心资源离线调度方法。深度强化学习可以为资源调度管理的人为启发式方法提供一个可行的替代方案。通过不断学习，深度强化学习方法可以针对特定工作负载(例如周期性负载或随机负载)进行优化，并在各种条件下保持高质量优化调度结果。把最小化平均作业slowdown(系统减缓时间)作为优化目标，通过计算离线调度中每一次调度的奖励值，引导深度网络向着目标优化，最终向着最优目标训练。结果显示，在本发明的大量实施例测试中，使用深度强化学习的离线调度方法的slowndown远低于SJF(最短作业优先算法)等传统的优化作业调度方法，体现出深度强化学习方法在这一领域的优势。
搜索关键词：	强化学习离线调度数据中心资源计算机技术领域资源调度管理周期性负载调度结果工作负载目标训练目标优化随机负载优化目标质量优化作业调度传统的启发式最小化算法优化测试替代奖励网络学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度强化学习的数据中心资源离线调度方法，其特征在于，所述数据中心资源离线调度系统包括：数据源模块，用于生成离线调度作业的数据，数据包括作业的所需资源类型(例如，CPU，内存，I/O)、作业的所需资源大小、离线作业的总体数量；运行环境模块，用于构建运行环境模型，所述运行环境包含分配的群集资源Cluster、等待作业槽JobSlot。运行环境模块中的所有部分都以单元格的图像表示出来；评价机制学习模块，用于将获得的信息结合评价机制得到所需要的奖赏函数，奖赏函数作为反馈输送至控制策略学习模块，进行优化网络参数；控制策略学习模块，用于深度强化学习方法的优化策略学习，通过得到的奖赏函数从而用于指导之后的离线作业调度序列，并通过策略更新神经网络参数，得到所述资源离线调度作业最终的实际操纵策略。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于田文洪;叶宇飞;王金;黄文强，未经田文洪;叶宇飞;王金;黄文强许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711399661.6/，转载请声明来源钻瓜专利网。

上一篇：基于Nginx服务器的集群控制方法以及服务器
下一篇：一种调整业务容器的方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度强化学习的数据中心资源离线调度方法在审

专利文献下载