[发明专利]一种分布式训练中的梯度更新方法及相关设备在审

专利信息
申请号: 201810833991.X 申请日: 2018-07-26
公开(公告)号: CN109102075A 公开(公告)日: 2018-12-28
发明(设计)人: 胡文晖;王鹏;王奇刚 申请(专利权)人: 联想(北京)有限公司
主分类号: G06N3/08 分类号: G06N3/08
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 王宝筠
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 梯度更新 计算节点 服务器 全局 步数 参数服务器 轮换 更新 目标数据 训练模型 累加 传输 监测 申请
【权利要求书】:

1.一种分布式训练中的梯度更新方法,应用于计算节点服务器,所述方法包括:

监测对目标数据进行分布式训练的全局轮换更新步数;

基于所述全局轮换更新步数满足所述计算节点服务器的全局梯度更新条件的判断,将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中,由所述参数服务器对全局训练模型基于所述本地梯度累计值进行梯度更新;

基于所述全局轮换更新步数不满足所述计算节点服务器的全局梯度更新条件的判断,计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中。

2.根据权利要求1所述的方法,其特征在于,计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中,包括:

基于本地训练模型,计算当前本地梯度;

将所述当前本地梯度累加到所述本地梯度累计值中。

3.根据权利要求1或2所述的方法,其特征在于,还包括:

基于所述当前本地梯度,对所述计算节点服务器中的本地训练模型进行梯度更新。

4.根据权利要求1或2所述的方法,其特征在于,还包括:

接收所述参数服务器传输的全局训练模型,所述参数服务器传输的全局训练模型为经过基于所述本地梯度累计值的梯度更新后的模型;

将接收到的全局训练模型更新为所述计算节点服务器的本地训练模型。

5.根据权利要求1或2所述的方法,其特征在于,所述全局梯度更新条件包括:全局轮换更新步数与计算节点服务器的本地轮换标识相对应。

6.一种分布式训练中的梯度更新装置,应用于计算节点服务器,所述装置包括:

步数监测单元,用于监测对目标数据进行分布式训练的全局轮换更新步数;

条件判断单元,用于判断所述全局轮换更新步数是否满足所述计算节点服务器的全局梯度更新条件,如果是,触发梯度更新单元,否则,触发梯度累计单元;

梯度更新单元,用于将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中,由所述参数服务器对全局训练模型基于所述本地梯度累计值进行梯度更新;

梯度累计单元,用于计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中。

7.一种计算节点服务器,包括:

存储器,用于存储应用程序及所述应用程序运行所产生的数据;

处理器,用于执行所述应用程序,以实现功能:监测对目标数据进行分布式训练的全局轮换更新步数;基于所述全局轮换更新步数满足所述计算节点服务器的全局梯度更新条件的判断,将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中,由所述参数服务器对全局训练模型基于所述本地梯度累计值进行梯度更新;基于所述全局轮换更新步数不满足所述计算节点服务器的全局梯度更新条件的判断,计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中。

8.一种训练集群,包括:

参数服务器,用于存储全局训练模型;

计算节点服务器,用于监测对目标数据进行分布式训练的全局轮换更新步数;基于所述全局轮换更新步数满足所述计算节点服务器的全局梯度更新条件的判断,将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中,由所述参数服务器对全局训练模型基于所述本地梯度累计值进行梯度更新;基于所述全局轮换更新步数不满足所述计算节点服务器的全局梯度更新条件的判断,计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中。

9.根据权利要求8所述的训练集群,其特征在于,所述计算节点服务器具体用于:基于本地训练模型,计算当前本地梯度;将所述当前本地梯度累加到所述本地梯度累计值中。

10.根据权利要求8或9所述的训练集群,其特征在于,所述计算节点服务器还用于:接收所述参数服务器传输的全局训练模型,所述参数服务器传输的全局训练模型为经过基于所述本地梯度累计值的梯度更新后的模型;将接收到的全局训练模型更新为所述计算节点服务器的本地训练模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810833991.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top