[发明专利]一种梯度传输的方法及分布式训练系统有效
| 申请号: | 201910101338.9 | 申请日: | 2019-01-31 | 
| 公开(公告)号: | CN109919313B | 公开(公告)日: | 2021-06-08 | 
| 发明(设计)人: | 徐华;徐宇啸;吕跃强 | 申请(专利权)人: | 华为技术有限公司 | 
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 | 
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 冯艳莲 | 
| 地址: | 518129 广东*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | 本申请公开了一种梯度传输的方法及分布式训练系统,用以提升训练过程中产生的梯度的传输效率,提高分布式训练的训练效率。该方法包括:根据输入的训练数据,获取神经网络模型的第i层神经元对应的权重的梯度;将第i层神经元对应的权重的梯度发送至梯度缓存区;判断梯度缓存区内存储的梯度的数量是否超过传输阈值;根据判断结果,将梯度缓存区内存储的梯度发送至梯度收集模块;获取根据梯度收集模块内存储的多个神经网络模型发送的梯度得到的神经网络模型的第i层神经元对应的权重的梯度均值;并根据第i层神经元对应的权重的梯度均值更新对应的权重,以执行神经网络模型的下一次迭代。 | ||
| 搜索关键词: | 一种 梯度 传输 方法 分布式 训练 系统 | ||
【主权项】:
                1.一种梯度传输的方法,所述方法应用于神经网络模型的分布式训练系统,其特征在于,所述分布式训练系统包括多个神经网络模型,每个神经网络模型包括n层神经元,每层神经元对应至少一个权重,其中,n为正整数,所述方法包括:每个神经网络模型在一次迭代中,根据输入的训练数据,获取所述神经网络模型的第i层神经元对应的权重的梯度,其中,i为不大于n的正整数;将所述神经网络模型的第i层神经元对应的权重的梯度发送至所述神经网络模型的梯度缓存区;判断所述神经网络模型的梯度缓存区内存储的梯度的数量是否超过确定出的传输阈值;根据判断结果,将所述神经网络模型的梯度缓存区内存储的梯度发送至梯度收集模块;获取根据所述梯度收集模块内存储的所述多个神经网络模型发送的梯度得到的所述神经网络模型的第i层神经元对应的权重的梯度均值;根据所述神经网络模型的第i层神经元对应的权重的梯度均值更新所述神经网络模型的第i层神经元对应的权重,以执行所述神经网络模型的下一次迭代。
            
                    下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
                
                
            该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910101338.9/,转载请声明来源钻瓜专利网。





