[发明专利]基于通信操作稀疏化的分布式深度学习多步延迟更新方法有效
申请号: | 202011312697.8 | 申请日: | 2020-11-20 |
公开(公告)号: | CN112463189B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 董德尊;徐叶茂;徐炜遐;廖湘科 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F8/65 | 分类号: | G06F8/65;G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京丰浩知识产权代理事务所(普通合伙) 11781 | 代理人: | 董超 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于通信操作稀疏化的分布式深度学习多步延迟更新方法,其具体步骤包括:热身训练,在进行多步延迟迭代训练前利用同步随机梯度下降方法对深度学习模型进行一定迭代次数的训练;切换阶段,其目的是为了将同步随机梯度下降更新方法切换为多步延迟训练模式;本地参数更新操作采用基于全局梯度的本地更新方法,目的是为了缓解权重延迟,保证模型的收敛精度;多步延迟训练,其具体包括全局参数更新、本地参数更新和通信操作稀疏化三个步骤。本发明通过采用通信操作稀疏化,减缓了网络拥塞,消除了同步开销,很大程度降低了分布式训练过程中的通信开销,优化了训练过程的通信开销。 | ||
搜索关键词: | 基于 通信 操作 稀疏 分布式 深度 学习 延迟 更新 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011312697.8/,转载请声明来源钻瓜专利网。
- 上一篇:可大幅提升热回收率的热泵机组
- 下一篇:电子元器件瑕疵定位方法及存储介质