[发明专利]一种构建slurm调度并行计算集群的方法有效
| 申请号: | 202210383566.1 | 申请日: | 2022-04-12 |
| 公开(公告)号: | CN114745385B | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 王建 | 申请(专利权)人: | 吉林大学 |
| 主分类号: | H04L67/10 | 分类号: | H04L67/10;H04L67/1001;H04L67/1095;H04L67/60;H04L9/40 |
| 代理公司: | 成都宏田知识产权代理事务所(普通合伙) 51337 | 代理人: | 钟隆辉 |
| 地址: | 130012 吉*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 构建 slurm 调度 并行 计算 集群 方法 | ||
1.一种构建slurm调度并行计算集群的方法,其特征在于,计算集群的构建方法如下:
步骤一:硬件准备;需要两台或者两台以上的计算设备,上限取决于交换机端口数,需要给每台机器安装完毕系统,正确连接交换机,通过以下四个核心模块实现集群搭建:setup_hpc模块作为集群系统正常运转的核心枢纽,承担用户鉴权认证,基于openSSH密钥做鉴权,基于scp+rsync下发配置并同步指令;os_setup_all.sh模块为科学计算方向的Linux系统调优设定;prepare.sh和slurm_all.sh模块相互依赖,自动从网络获取slurm源码并自动构建适用于科学计算平台的调度器二进制文件和相适应的配置设定;
步骤二:开机后,按照实际要求,修改hostname并设定实际的IP址并记录网络信息,包括:依次开启master,nodeXX机器,使用nmtui指令,设定hostname和IP地址,所有机器运行同样版本的Linux系统,所有机器的root用户具有相同的默认登录密码;
在微软机器新建记事本,录入网络信息,一行一个条目,网络地址末尾和英文之间,用一个或者多个空格均可,保存文件为cluster-net.txt;
步骤三:选取其中一个为master主机,登录master节点,其中一个接入集群专属交换机,另外一个负载用户登录,具体包括:登录master机器,将cluster-net.txt文件全部内容粘贴到master机器上/etc/hosts文件最后面,并保存修改;上传hpc4youtoolkit到master机器,依照手册或按照顺序和屏幕提示,运行对应模块;
步骤四:组网成功即并行计算集群组建成功。
2.根据权利要求1所述的一种构建slurm调度并行计算集群的方法,其特征在于,所述的步骤三标注为master的主机至少具备两个网卡。
3.根据权利要求2所述的一种构建slurm调度并行计算集群的方法,其特征在于,所述的步骤三标注为master的主机可以访问互联网。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210383566.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种五金产品制造用板材冲压成型装置
- 下一篇:一种钢表面涂层的检测方法及系统





