[发明专利]用于模型训练的运行控制方法、装置和电子设备有效
申请号: | 202210542222.0 | 申请日: | 2022-05-18 |
公开(公告)号: | CN114862655B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 曾锦乐;李敏;吴志华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06V10/774 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 单冠飞 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 模型 训练 运行 控制 方法 装置 电子设备 | ||
1.一种用于模型训练的运行控制方法,包括:
在多个GPU采用第一批次的训练数据进行模型训练的过程中,采用CPU上运行的多个第一进程读取所述第一批次之后第二批次的训练数据,其中,所述模型训练是采用所述多个GPU进行并行训练,各个GPU对模型训练的过程是相互独立的;
将所述多个第一进程读取的所述第二批次的训练数据,根据所有第一进程读取的训练数据的长度进行数据排序,以根据排序结果,确定各所述第一进程对应的目标训练数据;
向各所述第一进程对应的第二进程发送所述目标训练数据,以使各所述第二进程对应的GPU在采用第一批次的训练数据进行模型训练完毕后,采用所述第二进程接收到的目标训练数据进行模型训练;
其中,所述在多个GPU采用第一批次的训练数据进行模型训练的过程中,采用CPU上运行的多个第一进程读取所述第一批次之后第二批次的训练数据,包括:
在多个GPU采用所述第一批次的训练数据进行模型训练的过程中,采用所述CPU上运行的各所述第二进程向对应的第一进程发送控制信息,其中,所述控制信息用于控制所述第一进程读取所述第一批次之后第二批次的训练数据。
2.根据权利要求1所述的方法,其中,所述向各所述第一进程对应的第二进程发送所述目标训练数据,以使各所述第二进程对应的GPU在采用第一批次的训练数据进行模型训练完毕后,采用所述第二进程接收到的目标训练数据进行模型训练,包括:
监听各所述第二进程内的目标子进程;其中,所述目标子进程,用于从所属第二进程所对应的第一进程获取所述目标训练数据;
在监听到至少一个所述第二进程的目标子进程获取到所述目标训练数据的情况下,将所述目标训练数据发送至对应的GPU,以使各所述第二进程对应的GPU在采用第一批次的训练数据进行模型训练完毕后,采用所述第二进程接收到的目标训练数据进行模型训练。
3.根据权利要求2所述的方法,其中,所述在监听到至少一个所述第二进程的目标子进程获取到所述目标训练数据的情况下,将所述目标训练数据发送至对应的GPU,以使各所述第二进程对应的GPU在采用第一批次的训练数据进行模型训练完毕后,采用所述第二进程接收到的目标训练数据进行模型训练,包括:
在监听到至少一个所述第二进程的目标子进程获取到所述目标训练数据的情况下,等待对应的GPU采用第一批次的训练数据进行模型训练完毕;
在对应的GPU采用第一批次的训练数据进行模型训练完毕的情况下,将所述目标训练数据发送至对应的GPU并触发对应的GPU采用所述目标训练数据进行模型训练。
4.根据权利要求1-3任一项所述的方法,其中,所述将所述多个第一进程读取的所述第二批次的训练数据,根据所有第一进程读取的训练数据的长度进行数据排序,以根据排序结果,确定各所述第一进程对应的目标训练数据,包括:
将所述多个第一进程读取的所述第二批次的训练数据,在所述多个第一进程之间进行同步,以使各所述第一进程得到所述多个第一进程所读取的训练数据的数据集合;
采用各所述第一进程对各自得到的数据集合内的训练数据,根据数据长度进行数据排序,以根据排序结果,从所述数据集合内确定对应的目标训练数据。
5.根据权利要求4所述的方法,其中,所述采用各所述第一进程对各自得到的数据集合内的训练数据,根据数据长度进行数据排序,以根据排序结果,从所述数据集合内确定对应的目标训练数据,包括:
对任一第一进程,对所述数据集合内的训练数据,根据数据长度进行数据排序;
根据所述第一进程对应的序号,将所述数据集合中排序为所述序号的训练数据作为所述第一进程对应的目标训练数据。
6.根据权利要求5所述的方法,其中,所述方法还包括:
根据所述第一进程的进程号i和所述CPU上运行的第一进程的总数M,确定对应的序号q;
其中,q取值是根据n*M+i确定,n为整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210542222.0/1.html,转载请声明来源钻瓜专利网。