[发明专利]一种任务并行处理的实现方法、装置、设备和介质有效

申请号：	202010093670.8	申请日：	2020-02-14
公开（公告）号：	CN111309479B	公开（公告）日：	2023-06-06
发明（设计）人：	董大祥;王海峰;于佃海;马艳军	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F9/50	分类号：	G06F9/50;G06N3/08;G06N20/00
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种任务并行处理实现方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了一种任务并行处理的实现方法、装置、设备和介质，涉及深度学习技术领域。该方法包括：确定目标任务的至少一个并行计算图；根据所述并行计算图的算子任务在集群中的硬件执行代价，筛选确定并行计算图以及算子调度方案，其中，所述集群包括多个节点，用于执行所述算子任务；所述并行计算图具有至少一种算子调度方案；根据确定的并行计算图和算子调度方案，将所述并行计算图中的算子任务在所述集群中调度执行。本申请实施例的技术方案，在为目标任务确定并行计算图以及算子调度方案时，引入考虑了算子任务在集群中的硬件执行代价，作为筛选依据，能够更好使目标任务的执行适配于不同环境情况的集群，达到最优的并行效率。

技术领域

本申请实施例涉及计算机技术，具体涉及人工智能技术和并行处理技术。

背景技术

随着人工智能技术的发展，其中深度学习技术被越来越多的使用。深度学习技术，典型的包括深度学习模型的训练过程，以及训练后深度学习模型的应用过程。

目前，随着深度学习模型训练过程和应用过程的计算量增加，为了缩短时间，已经逐步采用了并行处理的方式。即，将深度学习模型的训练或应用任务，分配至由多节点构成的集群中，进行并行处理。例如采用GPU多机多卡进行并行训练。

现有技术中，如何能够提高深度学习模型计算过程并行处理的效率，是当前的研究热点方向之一。

发明内容

本申请实施例提供了一种任务并行处理的实现方法、装置、设备和介质，从而能够提高任务在集群中的并行处理效率。

第一方面，本申请实施例提供了一种任务并行处理的实现方法，包括：

确定目标任务的至少一个并行计算图，其中，所述并行计算图中包括多个算子任务；

根据所述并行计算图的算子任务在集群中的硬件执行代价，筛选确定并行计算图以及算子调度方案，其中，所述集群包括多个节点，用于执行所述算子任务；所述并行计算图具有至少一种算子调度方案；

根据确定的并行计算图和算子调度方案，将所述并行计算图中的算子任务在所述集群中调度执行。