[发明专利]一种数据处理方法和数据处理设备有效

专利信息
申请号: 202010231450.7 申请日: 2020-03-27
公开(公告)号: CN113449857B 公开(公告)日: 2022-08-19
发明(设计)人: 苏腾;陈婷婷;杨振章;张晓达 申请(专利权)人: 华为技术有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/02;G06F17/16
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 王仲凯
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据处理 方法 设备
【说明书】:

本申请实施例公开了一种数据处理方法,涉及人工智能领域,应用于分布式并行模型训练,例如文本翻译模型、语音识别模型、人脸识别模型、三维重建模型以及虚拟现实模型等的分布式训练,该方法可以支持混合并行在分布式集群中的实现。该方法包括:基于深度神经网络模型中每个算子的张量的张量排布,在具有输入输出依赖关系算子之间插入重排布算子,实现不同张量排布之间的转换,在切片计算图中插入重排布算子,确定更新后的切片计算图实现深度神经网络的并行模型训练。

技术领域

本申请涉及人工智能领域,尤其涉及一种数据处理方法和数据处理设备。

背景技术

在多个计算设备上部署深度学习模型是训练大规模复杂模型的一种方式。数据并行是应用最广的并行策略,但随着数据集和模型越来越大,单卡内存受限,训练设备数量不断增加,导致通信开销增长,数据并行遇到瓶颈,需要进行数据和模型混合并行。

深度学习模型的并行方案可以根据模型中所有算子的张量排布体现,张量排布包括设备矩阵、张量形状和张量映射。现有的网格张量流(Mesh-Tensorflow)方案中,可以对张量的任意维度进行切分,但是所有张量的设备矩阵必须相同。

由于Mesh-Tensorflow方案要求所有张量的设备矩阵相同,导致张量映射存在约束,例如,张量的样本维度必须映射到所有张量的设备矩阵的同一维度,限制了多种并行方式的转换,例如数据并行和模型并行的混合并行无法实现。

发明内容

本申请实施例提供了一种数据处理方法,应用于深度神经网络模型的训练的分布式集群,使得不同并行模式构成的混合并行可以在分布式集群中实现。

本申请实施例第一方面提供一种数据处理方法,本申请实施例提供的数据处理方法通常应用于分布式集群,该分布式集群中包括多个数据处理设备,本方法可以用于该分布式集群中的一个或多个数据处理设备中,该方法包括:获取深度神经网络模型,以及所述深度神经网络模型中每个算子的输入张量的张量排布和所述每个算子的输出张量的张量排布,所述张量排布包括设备矩阵、张量映射和张量形状,设备矩阵中的每个元素代表分布式集群中的一个数据处理设备,设备矩阵中所有元素对应的多个数据处理设备用于并行执行该深度神经网络模型,所述深度神经网络模型中包括第一算子和第二算子,所述第一算子和所述第二算子为所述深度神经网络模型中的两个连续算子,且所述第一算子的输出张量为所述第二算子的输入张量,第一张量排布与第二张量排布不一致,其中,所述第一张量排布为所述第一算子的输出张量的张量排布,所述第二张量排布为所述第二算子的输入张量的张量排布;根据所述每个算子的输入张量的张量排布和所述每个算子的输出张量的张量排布,确定数据处理设备的切片计算图;确定所述第一算子和所述第二算子之间的重排布算子,所述重排布算子用于将所述第一张量排布转换为所述第二张量排布;在所述切片计算图中插入所述重排布算子,以确定更新后的切片计算图,所述更新后的切片计算图用于指示执行所述深度神经网络模型的部分。

本申请实施例提供的数据处理方法,数据处理设备获取深度神经网络模型,以及其中所有算子的张量排布,包括输入张量的张量排布和输出张量的张量排布,其中,若存在连续的两个算子,第一算子的输出张量的张量排布与第二算子的输入张量的张量排布不一致,则根据该张量排布得到的切片计算图无法执行,本申请中,数据处理设备确定第一算子和第二算子之间的重排布算子,用于将第一算子的输出张量的张量排布转换为第二算子的输入张量的张量排布,由此,在切片计算图中插入重排布算子,确定的更新后的切片计算图可以被执行。该方案可以应用于深度神经网络模型中每个算子任意张量排布的情况,通过重排布算子实现并行方式的转换,使得各类混合并行可以在分布式集群中实现。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010231450.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top