[发明专利]面向神经网络计算的分布式数据路由的建模方法和装置有效
申请号: | 202210455426.0 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114598631B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 王宏升;何水兵;鲍虎军;陈光 | 申请(专利权)人: | 之江实验室 |
主分类号: | H04L45/00 | 分类号: | H04L45/00;H04L45/44;G06N3/08 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 奚丽萍 |
地址: | 310023 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 神经网络 计算 分布式 数据 路由 建模 方法 装置 | ||
本发明提供了一种面向神经网络计算的分布式数据路由的建模方法和装置,包括如下步骤:S1:设计物理张量的分布式属性:将逻辑张量与物理张量的映射关系抽象为广播属性、散播属性和局部规约属性三种分布式属性;S2:推演输出张量的分布式属性:指定输入张量的分布式属性,然后根据已知的输入张量的分布式属性推演输出张量的合法分布式属性;S3:根据分布式属性情形判断是否需要插入中间通信原语得到局部物理张量的分布式属性;利用所述的面向神经网络计算的分布式数据路由的建模方法和装置搭建模型,分布式设计和开发的难度低,推动了深度神经网络大模型落地应用的发展。
技术领域
本发明涉及基于特定计算模型的计算机系统领域,特别涉及一种面向神经网络计算的分布式数据路由的建模方法和装置。
背景技术
随着人工智能产业化应用的快速发展,大规模深度神经网络模型的分布式训练系统越来越成为学术界和工业界的研究热点。已有的深度学习编译器在编译神经网络分布式模型时将全局逻辑计算图产生的张量数据部署到不同设备进程的物理计算图的过程中,缺少统一的分布式路由策略。
发明内容
本发明的目的在于提供一种面向神经网络计算的分布式数据路由的建模方法和装置,以克服现有技术中的不足。
为实现上述目的,本发明提供如下技术方案:
本发明公开了一种面向神经网络计算的分布式数据路由的建模方法,包括如下步骤:
S1:设计物理张量的分布式属性:将逻辑张量与物理张量的映射关系抽象为广播属性、散播属性和局部规约属性三种分布式属性;
S2:推演输出张量的分布式属性:指定输入张量的分布式属性,然后根据已知的输入张量的分布式属性推演输出张量的合法分布式属性;
S3:根据分布式属性情形判断是否需要插入中间通信原语得到局部物理张量的分布式属性;
S4:推演中间通信原语类型,具体子步骤如下:
S41:推演生产者算子的输出张量的分布式属性:根据生产者算子的输入张量的分布式属性,推演输出张量的合法分布式属性;
S42:推演中间通信原语:根据生产者算子输出张量的分布式属性和消费者算子所需的输入张量的分布式属性,推演出所需的中间通信原语类型;
S5:推导出中间通信原语的传输代价:推导出不同分布式属性之间进行转换的通信代价;
S6:推导中间通信原语的建模方式,子步骤如下:
S61:定义基本的原子操作;
S62:构建复杂操作:复杂操作由基本原子操作复合而成;
采用或方式构建复杂目标操作,获取的目标操作是多个原子操作的并联关系;
采用分冶方式构建复杂操作,获取的目标操作是多个原子操作通过中间分布式属性的串联关系;
采用复合方式构建复杂操作,所述复合方式指通过串联和并联组合使用构建更加复杂的目标操作;
S7:插入传输代价最小的中间通信原语:选择传输代价最小的原语,将其插入到全局逻辑张量和局部物理张量之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210455426.0/2.html,转载请声明来源钻瓜专利网。