[发明专利]模型训练方法、装置、存储介质及电子设备在审

申请号：	202110412115.1	申请日：	2021-04-16
公开（公告）号：	CN113516239A	公开（公告）日：	2021-10-19
发明（设计）人：	陈子予;陶训强;何苗;郭彦东	申请（专利权）人：	OPPO广东移动通信有限公司
主分类号：	G06N3/08	分类号：	G06N3/08;G06N20/00
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	熊永强
地址：	523860 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型训练方法装置存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开一种模型训练方法、装置、存储介质及电子设备。其中，获取多个数据集；将多个数据集逐个输入初始多任务模型；其中，所述初始多任务模型包含模型参数，所述模型参数包含共享参数和任务参数；其中，所述共享参数为所述初始多任务模型中多个任务共有的模型参数，所述任务参数为所述初始多任务模型中多个任务中每个任务独有的模型参数；基于所述初始多任务模型的输出结果调整所述模型参数，得到训练后的多任务模型。本方法能够避免针对同一训练样本进行重复计算的问题，提高了训练效率，节省了计算资源。

技术领域

本公开涉及人工智能技术领域，特别是涉及一种模型训练方法、装置、存储介质及电子设备。

背景技术

深度学习在图像识别，语音识别，自然语言处理等相关领域都取得很多成果，但是由于深度学习模型计算复杂，效率低，如果对于一些相近的任务，往往都各自使用一个模型，无疑增加了计算量和资源占用。

发明内容

根据本公开的一个方面，提供以下技术方案：

一种模型训练方法，包括：

获取多个数据集；

将多个数据集逐个输入初始多任务模型；其中，所述初始多任务模型包含模型参数，所述模型参数包含共享参数和任务参数；其中，所述共享参数为所述初始多任务模型中多个任务共有的模型参数，所述任务参数为所述初始多任务模型中多个任务中每个任务独有的模型参数；

基于所述初始多任务模型的输出结果调整所述模型参数，得到训练后的多任务模型。

进一步地，根据所述初始多任务模型的输出结果计算损失函数的总损失值，并根据所述损失值对所述多任务模型的模型参数进行调整。

进一步地，若每个数据集的任务标签数量为一个，则将该任务标签对应的任务的损失值作为该数据集的损失值，其中，根据每个数据集的损失值计算得到损失函数的总损失值。