[发明专利]slurm调度系统的节点扩容方法、装置、设备和介质有效
申请号: | 202111370556.6 | 申请日: | 2021-11-18 |
公开(公告)号: | CN114172903B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 王金喜 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | H04L67/10 | 分类号: | H04L67/10;H04L41/0813;H04L67/1074;H04L67/303 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 刘艳丽 |
地址: | 215168 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | slurm 调度 系统 节点 扩容 方法 装置 设备 介质 | ||
本申请涉及一种slurm调度系统的节点扩容方法、装置、设备和介质。所述方法包括:接收终端发送的节点扩容请求;当节点扩容请求中的新增节点存在于slurm调度系统所部署的目标集群中时,获取slurm调度配置文件;当slurm调度配置文件中不存在新增节点的slurm调度配置数据时,向新增节点发送slurm客户端的安装请求;在接收到安装完成的通知信息时,获取新增节点的slurm调度配置数据,将slurm调度配置数据更新至slurm调度配置文件中,以述slurm调度系统进行节点扩容。本申请实现自动扩容,解决了现有技术中需要人为输入命令,实现扩容的繁琐步骤,提升slurm调度系统的节点扩容效率。
技术领域
本申请涉及数据处理技术领域,特别是涉及一种slurm调度系统的节 点扩容方法、装置、设备和介质。
背景技术
slurm是一个开源、容错、高度可扩展的集群管理和作业调度系统,适 用于大型和小型Linux集群。它提供了三个关键功能。首先,它在一段时 间内为用户分配对资源(计算机节点)的独占和/或非独占访问权限,以便他们可以执行工作。其次,它提供了一个框架,用于在一组分配的节点上 启动,执行和监视工作(通常是并行作业,例如MPI)。最后,它通过管 理待处理作业队列来仲裁资源争用。实际应用中,经常会出现slurm调度 系统的计算能力不足的情况,在这种情况下,需要进行slurm调度系统的 扩容。
目前,当slurm调度系统需要扩容时,一般是通过各种命令操作实现 节点的扩容,该方案需要人为手动干预,步骤繁琐,效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种slurm调度系统的节点 扩容方法、装置、设备和介质。
一种slurm调度系统的节点扩容方法,方法包括:
接收终端发送的slurm调度系统的节点扩容请求;
当节点扩容请求中的新增节点存在于slurm调度系统所部署的目标集 群中时,获取预先配置的slurm调度配置文件;
当slurm调度配置文件中不存在新增节点的slurm调度配置数据时, 向新增节点发送slurm客户端的安装请求;
在接收到新增节点发送的安装完成的通知信息时,获取新增节点的 slurm调度配置数据,将slurm调度配置数据更新至slurm调度配置文件中, 以对slurm调度系统进行节点扩容。
在其中一个实施例中,上述的方法还包括:
查询预设数据库,当预设数据库中存在新增节点的通信配置数据时, 确定新增节点存在于目标集群中。
在其中一个实施例中,上述的方法还包括:
根据slurm调度配置数据中的CPU核数以及内存的容量为新增节点分 配任务;
获取新增节点的任务执行状态;
当任务执行状态为正常运行时,生成新增节点成功加载到slurm调度 系统的通知信息,并发送至终端;
当任务执行状态为异常运行时,生成新增节点的运行日志信息;
将运行日志信息发送至终端。
在其中一个实施例中,上述的方法还包括:
当根据通信配置数据确定目标集群中不存在新增节点时,向终端发送 将新增节点添加至目标集群中的通知信息。
在其中一个实施例中,上述的方法还包括:
当slurm调度配置文件中存在新增节点的slurm调度配置信息时,向 终端发送是否扩容下一个节点的提示信息。
在其中一个实施例中,上述的方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111370556.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种柜角安装可隐藏式多功能插座
- 下一篇:洪水救生门