[发明专利]基于拓扑感知的高性能计算系统运行环境部署加速方法及系统在审
| 申请号: | 202110865567.5 | 申请日: | 2021-07-29 |
| 公开(公告)号: | CN113630269A | 公开(公告)日: | 2021-11-09 |
| 发明(设计)人: | 王睿伯;张文喆;卢凯;迟万庆;董勇;张伟;邬会军;吴振伟;谢旻;周恩强;李佳鑫;邵明天 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
| 主分类号: | H04L12/24 | 分类号: | H04L12/24;G06F16/176;G06F16/182 |
| 代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 胡君 |
| 地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 拓扑 感知 性能 计算 系统 运行 环境 部署 加速 方法 | ||
1.一种基于拓扑感知的高性能计算系统运行环境部署加速方法,其特征在于,步骤包括:
S01.基于高性能计算系统的网络拓扑结构,在登陆结点上维护代理结点集以及每个代理结点的附属结点集;
S02.当接收到用户发送的部署请求时,所述部署请求为将当前作业及当前作业的依赖文件部署到指定计算结点的请求,获取所述部署请求中指定的计算结点列表,根据所述计算结点列表以及维护的所述代理结点集、附属结点集生成运行环境部署树,其中将所述代理结点配置为靠近根结点,以及将所述代理结点的附属结点配置为树结构中代理结点的子结点并将各所述子结点设置为叶结点;
S03.按照步骤S02生成的所述运行环境部署树,将所需文件以及树结构体从第一层依次向下进行分发,每层按照接收到的所述树结构查询自己的下一层结点并继续向下分发,直到所有的所述叶结点接收到完整的文件。
2.根据权利要求1所述的基于拓扑感知的高性能计算系统运行环境部署加速方法,其特征在于:所述步骤S02中生成运行环境部署树时,若存在目的代理结点不在当前作业的所述计算结点列表中,以及在所述计算结点列表中目的节点的子结点的数量超过预设阈值,且目的代理结点处于作业空闲状态,则将目的代理结点临时加入到所述树形结构中;所述步骤S03中在传输任务完成之后,还包括将临时加入所述树形结构的目的代理结点的状态改回空闲状态。
3.根据权利要求1所述的基于拓扑感知的高性能计算系统运行环境部署加速方法,其特征在于:所述步骤S02中生成运行环境部署树时,还包括根据维护的所述代理结点集、附属结点集,将所述计算结点列表划分为主板子集、孤儿子集,其中每个所述主板子集为指定物理主板上代理结点及所述代理结点的附属结点的集合,每个所述孤儿子集为目的物理主板上的所述附属结点的集合,所述目的物理主板为代理节点并不在所述计算结点列表中的物理主板;依次处理各所述主板子集、各所述孤儿子集,以使得将所述代理结点配置为靠近根结点,以及将所述代理结点的附属结点配置为所述运行环境部署树中代理结点的子结点,生成所述运行环境部署树。
4.根据权利要求3所述的基于拓扑感知的高性能计算系统运行环境部署加速方法,其特征在于,处理所述主板子集的步骤包括:
S201.将当前主板子集中的代理结点加入到树结构中,其中父结点是根结点或者代理结点;
S202.将当前主板子集中的附属结点加入到树结构中,其中父结点是当前主板子集中的代理结点,也是树结构的叶结点。
5.根据权利要求3所述的基于拓扑感知的高性能计算系统运行环境部署加速方法,其特征在于,处理所述孤儿子集的步骤包括:
S211.判断所述孤儿子集是否为空,如果非空则计算每个所述孤儿子集中的孤儿结点个数;
S212.判断计算得到的所述孤儿结点个数,如果超过预设阈值则转入步骤S213,如果所述孤儿结点个数不超过预设阈值或者代理结点并不是空闲的,转入步骤S214;
S213.查看当前主板上代理结点的状态,如果是空闲状态则将当前主板上代理节点作为目的代理结点临时加入到树结构中,并将目的代理结点的状态修改为占用状态;
S214.将所述孤儿子集中的结点加入到树结构的最后一层。
6.根据权利要求1~5中任意一项所述的基于拓扑感知的高性能计算系统运行环境部署加速方法,其特征在于:步骤S02中,具体将当前登录结点配置为所述运行环境部署树的根结点。
7.根据权利要求1~5中任意一项所述的基于拓扑感知的高性能计算系统运行环境部署加速方法,其特征在于,所述步骤S03的步骤包括:
S301.将生成的所述运行环境及树结构体传递给第一层结点;
S302.当前层中每个结点收到所述运行环境以及树结构体后,查询当前结点是否是叶结点,如果不是则将接收到的所述运行环境以及树结构体,继续传递给树结构中当前结点自己的子结点;
S303.每个结点将所需文件传输给下一层结点完成之后,将传输完成的信号回传给根结点;
S304.当登录结点接收到所有非叶结点的回传信号之后,完成所有的传输工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110865567.5/1.html,转载请声明来源钻瓜专利网。





