[发明专利]资源配置方法、模型训练方法及装置在审
| 申请号: | 202210311635.8 | 申请日: | 2022-03-28 |
| 公开(公告)号: | CN114625541A | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 杨天 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N3/04;G06N3/08;G06T1/20 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 吕俊秀 |
| 地址: | 100080 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 资源配置 方法 模型 训练 装置 | ||
1.一种资源配置方法,其特征在于,包括:
获取神经网络模型的模型参数,及图形处理器对应的目标数量;
获取与所述模型参数和所述目标数量匹配的目标图形处理器;
根据所述目标图形处理器对应的配置信息,确定所述目标图形处理器之间的参数更新模式;
基于所述目标图形处理器和所述参数更新模式,确定所述神经网络模型的资源配置信息。
2.根据权利要求1所述的方法,其特征在于,所述获取与所述模型参数和所述目标数量匹配的目标图形处理器,包括:
获取与所述模型参数匹配的第一数量的初始图形处理器;所述第一数量大于或者等于所述目标数量;
根据所述初始图形处理器的资源数据,从所述初始图形处理器中筛选出所述目标数量的目标图形处理器。
3.根据权利要求2所述的方法,其特征在于,所述根据所述初始图形处理器的资源数据,从所述初始图形处理器中筛选出所述目标数量的目标图形处理器,包括:
根据所述资源数据,从所述初始图形处理器中筛选出可用资源数据大于设定数据阈值的第二数量的图形处理器;
在所述第二数量大于所述目标数量的情况下,按照所述使用频率由高到低的顺序,从所述第二数量的图形处理器中筛选出目标数量的目标图形处理器。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标图形处理器对应的配置信息,确定所述目标图形处理器之间的参数更新模式,包括:
获取所述目标图形处理器的节点类型,及所述目标图形处理器之间的节点带宽;
根据所述节点类型、所述节点带宽和所述目标数量,确定所述目标图形处理器之间的参数更新模式。
5.一种模型训练方法,其特征在于,包括:
获取待训练的神经网络模型的资源配置信息;
根据所述资源配置信息,确定所述神经网络模型对应的目标图形处理器和参数更新模式;
获取训练样本数据;
在对所述神经网络模型进行训练的过程中,基于所述目标图形处理器传输所述训练样本数据;
在计算得到所述神经网络模型的损失函数之后,根据所述损失函数和所述参数更新模式,更新所述神经网络模型的模型参数,直至训练得到目标神经网络模型。
6.根据权利要求5所述的方法,其特征在于,所述资源配置信息为多条信息,
在所述根据所述损失函数和所述参数更新模式,更新所述神经网络模型的模型参数,直至训练得到目标神经网络模型之后,还包括:
获取所述神经网络模型输出的所述资源配置信息的评分值;
根据所述评分值,从所述资源配置信息中筛选出评分值最大的资源配置信息,并将所述评分值最大的资源配置信息作为目标类型的网络模型的资源配置信息;
所述目标类型的网络模型是指与所述神经网络模型的类型相同的模型类型。
7.一种资源配置装置,其特征在于,包括:
目标数量获取模块,用于获取神经网络模型的模型参数,及图形处理器对应的目标数量;
目标处理器获取模块,用于获取与所述模型参数和所述目标数量匹配的目标图形处理器;
参数更新模式确定模块,用于根据所述目标图形处理器对应的配置信息,确定所述目标图形处理器之间的参数更新模式;
资源配置信息确定模块,用于基于所述目标图形处理器和所述参数更新模式,确定所述神经网络模型的资源配置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210311635.8/1.html,转载请声明来源钻瓜专利网。





