[发明专利]分布式训练路由方法、系统、储存介质及计算机设备有效
申请号: | 202110082811.0 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112702267B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 武继刚;陈招红;龙鑫;陈龙;孙为军 | 申请(专利权)人: | 广东工业大学 |
主分类号: | H04L45/12 | 分类号: | H04L45/12;H04L45/48 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 张金福 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 训练 路由 方法 系统 储存 介质 计算机 设备 | ||
1.一种分布式训练路由方法,其为基于数据融合的分布式训练中的网络节点,包括参数服务器节点、若干工作节点以及若干路由节点,获取分布式训练中的数据传递路径,其特征在于,包括以下步骤:
S01,获取各网络节点间的连接情况、各网络节点间的带宽容量、各网络节点的缓存容量以及工作节点的计算能力;
S02,根据各网络节点间的连接情况构建带权有向图,根据所述带权有向图,运用最短路径算法获取参数服务器节点到各工作节点的最短路径,以参数服务器节点到各工作节点的最短路径构建模型参数下发多播树;
S03,根据所述带权有向图,运用最短路径算法寻找各工作节点到参数服务器节点的最短路径;根据各网络节点间的带宽容量、各网络节点的缓存容量以及工作节点的计算能力,从各工作节点到参数服务器节点的最短路径中筛选出使得梯度更新数据到达参数服务器节点时间最晚的路径作为关键路径;
S04,构建梯度更新上传多播树,将所述关键路径加入到所述梯度更新上传多播树;
S05,遍历各工作节点,获取所述梯度更新上传多播树中未包含的工作节点到所述梯度更新上传多播树上的网络节点的最短路径,加入所述梯度更新上传多播树中;重复步骤S05直至所述梯度更新上传多播树包括各工作节点;
S06,根据所述模型参数下发多播树以及所述梯度更新上传多播树获取分布式训练中的数据传递路径。
2.根据权利要求1所述的分布式训练路由方法,其特征在于,所述步骤S03中包括以下步骤:
S031,根据所述模型参数下发多播树以及各网络节点间的带宽容量计算模型参数数据从参数服务器节点传输到各工作节点的时间;
S032,根据所述带权有向图,运用最短路径算法寻找各工作节点到参数服务器节点的最短路径;
S033,根据各网络节点间的带宽容量、各网络节点的缓存容量以及工作节点的计算能力,结合模型参数数据从参数服务器节点传输到各工作节点的时间,从各工作节点到参数服务器节点的最短路径中筛选出使得梯度更新数据到达参数服务器节点时间最晚的路径作为关键路径。
3.根据权利要求2所述的分布式训练路由方法,其特征在于,所述步骤S05中,包括以下步骤:
S051,根据各网络节点的缓存容量以及工作节点的计算能力,计算所述梯度更新上传多播树中的工作节点上传梯度更新数据的时间;
S052,遍历各工作节点,结合所述梯度更新上传多播树中的工作节点上传梯度更新数据的时间,获取所述梯度更新上传多播树中未包含的工作节点到所述梯度更新上传多播树上的网络节点的最短路径,加入所述梯度更新上传多播树中。
4.根据权利要求3所述的分布式训练路由方法,其特征在于,所述步骤S031中,模型参数数据从参数服务器节点传输到各工作节点的时间按以下公式计算:
其中,M表示网络节点的集合,N表示工作节点的集合,p表示模型参数数据的大小,表示模型参数数据从参数服务器发送至工作节点过程中网络节点i与网络节点j之间的路径,其中网络节点i与网络节点j为相邻节点,若网络节点i将模型参数数据通过网络节点j发送给工作节点,则反之
5.根据权利要求4所述的分布式训练路由方法,其特征在于,所述关键路径L*通过以下公式获取:
约束条件:
其中,Li,ε为第i个工作节点到参数服务器ε的最短路径,Ti为第i个工作节点的梯度更新数据沿着路径Li,ε上传到达参数服务器ε所需的时间;分别表示第i个工作节点的梯度更新计算时间和传输时间,D为单轮训练模型计算量的大小,q为梯度更新数据大小,q值大小与模型参数数据的大小p相等,wj表示网络节点j的带宽容量,gk表示网络节点k的缓存容量,表示梯度更新数据从工作节点发送到参数服务器节点过程中网络节点j与网络节点k之间的路径,其中网络节点j与网络节点k为相邻节点,若网络节点j将模型参数通过网络节点k发送给工作节点,则反之
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110082811.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种换药用便携式消毒箱
- 下一篇:一种具有双工质的高效超临界二氧化碳锅炉