[发明专利]分布式训练路由方法、系统、储存介质及计算机设备有效

专利信息
申请号: 202110082811.0 申请日: 2021-01-21
公开(公告)号: CN112702267B 公开(公告)日: 2023-04-07
发明(设计)人: 武继刚;陈招红;龙鑫;陈龙;孙为军 申请(专利权)人: 广东工业大学
主分类号: H04L45/12 分类号: H04L45/12;H04L45/48
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 张金福
地址: 510090 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分布式 训练 路由 方法 系统 储存 介质 计算机 设备
【权利要求书】:

1.一种分布式训练路由方法,其为基于数据融合的分布式训练中的网络节点,包括参数服务器节点、若干工作节点以及若干路由节点,获取分布式训练中的数据传递路径,其特征在于,包括以下步骤:

S01,获取各网络节点间的连接情况、各网络节点间的带宽容量、各网络节点的缓存容量以及工作节点的计算能力;

S02,根据各网络节点间的连接情况构建带权有向图,根据所述带权有向图,运用最短路径算法获取参数服务器节点到各工作节点的最短路径,以参数服务器节点到各工作节点的最短路径构建模型参数下发多播树;

S03,根据所述带权有向图,运用最短路径算法寻找各工作节点到参数服务器节点的最短路径;根据各网络节点间的带宽容量、各网络节点的缓存容量以及工作节点的计算能力,从各工作节点到参数服务器节点的最短路径中筛选出使得梯度更新数据到达参数服务器节点时间最晚的路径作为关键路径;

S04,构建梯度更新上传多播树,将所述关键路径加入到所述梯度更新上传多播树;

S05,遍历各工作节点,获取所述梯度更新上传多播树中未包含的工作节点到所述梯度更新上传多播树上的网络节点的最短路径,加入所述梯度更新上传多播树中;重复步骤S05直至所述梯度更新上传多播树包括各工作节点;

S06,根据所述模型参数下发多播树以及所述梯度更新上传多播树获取分布式训练中的数据传递路径。

2.根据权利要求1所述的分布式训练路由方法,其特征在于,所述步骤S03中包括以下步骤:

S031,根据所述模型参数下发多播树以及各网络节点间的带宽容量计算模型参数数据从参数服务器节点传输到各工作节点的时间;

S032,根据所述带权有向图,运用最短路径算法寻找各工作节点到参数服务器节点的最短路径;

S033,根据各网络节点间的带宽容量、各网络节点的缓存容量以及工作节点的计算能力,结合模型参数数据从参数服务器节点传输到各工作节点的时间,从各工作节点到参数服务器节点的最短路径中筛选出使得梯度更新数据到达参数服务器节点时间最晚的路径作为关键路径。

3.根据权利要求2所述的分布式训练路由方法,其特征在于,所述步骤S05中,包括以下步骤:

S051,根据各网络节点的缓存容量以及工作节点的计算能力,计算所述梯度更新上传多播树中的工作节点上传梯度更新数据的时间;

S052,遍历各工作节点,结合所述梯度更新上传多播树中的工作节点上传梯度更新数据的时间,获取所述梯度更新上传多播树中未包含的工作节点到所述梯度更新上传多播树上的网络节点的最短路径,加入所述梯度更新上传多播树中。

4.根据权利要求3所述的分布式训练路由方法,其特征在于,所述步骤S031中,模型参数数据从参数服务器节点传输到各工作节点的时间按以下公式计算:

其中,M表示网络节点的集合,N表示工作节点的集合,p表示模型参数数据的大小,表示模型参数数据从参数服务器发送至工作节点过程中网络节点i与网络节点j之间的路径,其中网络节点i与网络节点j为相邻节点,若网络节点i将模型参数数据通过网络节点j发送给工作节点,则反之

5.根据权利要求4所述的分布式训练路由方法,其特征在于,所述关键路径L*通过以下公式获取:

约束条件:

其中,Li,ε为第i个工作节点到参数服务器ε的最短路径,Ti为第i个工作节点的梯度更新数据沿着路径Li,ε上传到达参数服务器ε所需的时间;分别表示第i个工作节点的梯度更新计算时间和传输时间,D为单轮训练模型计算量的大小,q为梯度更新数据大小,q值大小与模型参数数据的大小p相等,wj表示网络节点j的带宽容量,gk表示网络节点k的缓存容量,表示梯度更新数据从工作节点发送到参数服务器节点过程中网络节点j与网络节点k之间的路径,其中网络节点j与网络节点k为相邻节点,若网络节点j将模型参数通过网络节点k发送给工作节点,则反之

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110082811.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top