[发明专利]一种协同训练方法、装置及计算机可读存储介质在审
申请号: | 202110987831.2 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113705662A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 杜星波;陈滢;高鹏飞;郑建宾;赵金涛;李幸;黄珊珊;吕楠;魏子朝 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 操寒 |
地址: | 201203 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 协同 训练 方法 装置 计算机 可读 存储 介质 | ||
1.一种协同训练方法,其特征在于,包括:
利用训练数据集分别对多个任务进行预训练,得到多个任务模型;
基于所述多个任务模型迭代进行协同训练,其中,在每次迭代中,获取至少一个所述任务模型针对样本的输出结果,将至少一个输出结果和所述样本对应于指定任务的特征值一并输入指定任务模型以进行所述协同训练。
2.根据权利要求1所述的方法,其特征在于,所述协同训练方法为半监督训练方法。
3.根据权利要求1所述的方法,其特征在于,所述预训练还包括:
获取T个任务对应的T个训练数据集,其中,任务k对应的训练数据集至少包括样本i的特征向量xki;
将每个任务对应于各个样本的特征向量和指定数量的空特征和/或随机特征进行矢量组合,以创建每个任务对应于各个样本的第一组合特征,所述空特征和/或随机特征为第一组合特征的附加特征的初始值;
基于所述第一组合特征对T个任务进行所述预训练,得到T个任务模型;
其中,k为任务标识,取值为1至T之间的整数,i为样本标识,取值为1至dk之间的整数,dk为任务k的样本个数,相同的样本标识指示相同的样本对象。
4.根据权利要求3所述的方法,其特征在于,所述指定数量根据每个任务有关联的其他任务的数量而确定;或者,所述指定数量为T-1。
5.根据权利要求1所述的方法,其特征在于,所述任务k对应的所述训练数据集包括所述特征向量及其标签。
6.根据权利要求3所述的方法,其特征在于,所述协同训练还包括迭代执行以下步骤:
获取每个任务对应于样本i的所述第一组合特征,所述第一组合特征包括所述特征向量和所述附加特征;以及,
将每个任务对应于样本i的所述第一组合特征分别输入对应的任务模型中,得到每个任务对应于样本i的输出结果;
根据指定任务以外的一个或多个其他任务对应于样本i的所述输出结果对所述指定任务对应于样本i的所述第一组合特征的所述附加特征进行更新,得到所述指定任务对应于样本i的第二组合特征;
将所述指定任务对应于样本i的第二组合特征输入所述指定任务模型,以进行所述协同训练。
7.根据权利要求6所述的方法,其特征在于,在每次迭代之后,还包括:
根据所述指定任务对应于样本i的所述第二组合特征对所述第一组合特征进行迭代更新。
8.根据权利要求1所述的方法,其特征在于,得到所述指定任务对应于样本i的第二组合特征之后,还包括:
获取对应于所述第二组合特征中的每个附加特征的权重系数;
基于所述权重系数对所述第二组合特征中的每个附加特征进行加权,得到所述指定任务对应于样本i的第三组合特征;
根据所述指定任务对应于样本i的所述第三组合特征对所述指定任务模型进行训练。
9.根据权利要求1所述的方法,其特征在于,获取对应于所述第二组合特征中的每个附加特征的权重系数,还包括:
依据以下公式计算对应于任务k的附加特征的所述权重系数αk:
其中,k取值为1至T之间的整数,β是预设参数,x′ki为所述第一组合特征的初始值,x″ki为所述第二组合特征。
10.根据权利要求6所述的方法,其特征在于,所述预设参数β根据任务之间的关联性程度确定。
11.根据权利要求6所述的方法,其特征在于,所述指定任务为所述T个任务中的每一个任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110987831.2/1.html,转载请声明来源钻瓜专利网。