[发明专利]训练机器学习模型在审
申请号: | 201880013612.0 | 申请日: | 2018-02-19 |
公开(公告)号: | CN110520871A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | M.根德隆-贝勒马尔;J.L.梅尼克;A.B.格雷夫斯;K.卡沃克库格鲁;R.穆诺斯 | 申请(专利权)人: | 渊慧科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 11105 北京市柳沈律师事务所 | 代理人: | 金玉洁<国际申请>=PCT/EP2018 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练数据 训练机器 学习 进度测量 任务选择 计算机存储介质 机器学习模型 计算机程序 策略选择 模型参数 训练进度 更新 | ||
1.一种训练具有多个模型参数的机器学习模型以从模型参数的初始值确定模型参数的训练值的方法,所述方法包括:
接收用于在多个任务上训练机器学习模型的训练数据,其中每个任务包括相应的多批训练数据;以及
通过重复地执行以下操作来在所述训练数据上训练机器学习模型:
根据当前任务选择策略从所述多个任务中选择任务;
从所选任务的多批训练数据中选择一批训练数据;
在所选的一批训练数据上训练机器学习模型,以从所述模型参数的当前值确定所述模型参数的更新值;
确定表示作为在所选的一批训练数据上训练机器学习模型的结果的机器学习模型的训练进度的学习进度测量;以及
使用所述学习进度测量来更新所述当前任务选择策略。
2.如权利要求1所述的方法,其中,在所选批上训练机器学习模型包括训练机器学习模型以减少由损失函数测量的所选批上的损失,并且其中所述学习进度测量基于作为在所选的一批训练数据上训练机器学习模型的结果的所述损失中的减少。
3.如权利要求2所述的方法,其中,确定所述学习进度测量包括:
根据所述模型参数的当前值确定所选批上的第一损失;以及
根据所述模型参数的更新值确定所选批上的第二损失,并且
其中,所述学习进度测量包括所述第一损失和所述第二损失之间的差。
4.如权利要求1至3中任一项所述的方法,其中,确定所述学习进度测量包括:
从所选任务中的多个批采样新批;
根据所述模型参数的当前值确定新批上的第一损失;以及
根据所述模型参数的更新值确定新批上的第二损失,并且
其中,所述学习进度测量包括所述第一损失和所述第二损失之间的差。
5.如权利要求1至4中任一项所述的方法,其中,所述任务之一被识别为目标任务,所述目标任务包括与在训练数据上训练机器学习模型之后要由机器学习模型处理的输入最相似的训练输入,其中确定所述学习进度测量包括:
从所述目标任务中的多个批采样新批;
根据所述模型参数的当前值确定新批上的第一损失;以及
根据所述模型参数的更新值确定新批上的第二损失,并且
其中,所述学习进度测量包括所述第一损失和所述第二损失之间的差。
6.如权利要求1至5中任一项所述的方法,其中,确定所述学习进度测量包括:
从所述多个任务随机采样任务;
从经采样的任务中的多个批采样新批;
根据所述模型参数的当前值确定新批上的第一损失;以及
根据所述模型参数的更新值确定新批上的第二损失,并且
其中,所述学习进度测量包括所述第一损失和所述第二损失之间的差。
7.如权利要求1至6中任一项所述的方法,其中,所述学习进度测量包括关于通过在所选批上训练机器学习模型而生成的所述模型参数的、所述损失函数的梯度的梯度向量的范数。
8.如权利要求1至7中任一项所述的方法,其中,所述学习进度测量基于作为在所选的一批训练数据上训练机器学习模型的结果的机器学习模型的模型复杂度的增加。
9.如权利要求1至8中任一项所述的方法,其中,所述模型参数的值由所述模型参数的可能值的后验分布定义,其中在训练期间,参数化所述后验分布的后验分布参数被优化,使得所述模型参数的训练值由所述后验分布参数的训练值定义,并且其中在所选的一批训练数据上训练机器学习模型包括在所选的一批训练数据上训练机器学习模型以从后验分布参数的当前值确定所述后验分布参数的调整值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司,未经渊慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880013612.0/1.html,转载请声明来源钻瓜专利网。