[发明专利]一种模型的增量训练方法和装置在审
申请号: | 202110258520.2 | 申请日: | 2021-03-09 |
公开(公告)号: | CN113033631A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 刘晨晖;钟辉强;黄强;徐思琪;周厚谦 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 增量 训练 方法 装置 | ||
本公开公开了一种模型的增量训练方法和装置,涉及人工智能技术领域,进一步涉及大数据技术领域。具体实现方案为:基于原始样本集训练出的基础目标模型,获取原始样本集中每个原始样本的第一软标签,基于第一软标签,从原始样本集中选取部分原始样本作为第一样本,获取新增的第二样本和对应的第二软标签,将第一样本和对应的第一软标签以及第二样本和对应的第二软标签作为训练样本,将训练样本输入基础目标模型中进行模型训练,以生成最终的目标模型。本公开能够保留从之前原始样本集中已经学习得到的旧知识,将模型的可塑性与稳定性实现一个很好的平衡,较大幅度提高了模型迭代更新效率。
技术领域
本公开涉及人工智能技术领域,进一步涉及大数据技术领域。
背景技术
相关技术中,实现模型的增量学习主要有数据集扩充,参数微调,基于代表性样本和基于对抗生成网络等方法。但相关技术中的方法无法将模型的可塑性与稳定性实现一个很好的平衡,且模型迭代更新效率不高。
发明内容
本公开提供了一种模型的增量训练方法、装置、电子设备以及存储介质、计算机程序产品。
根据本公开的第一方面,提出了一种模型的增量训练方法,包括基于原始样本集训练出的基础目标模型,获取所述原始样本集中每个原始样本的第一软标签;基于所述第一软标签,从所述原始样本集中选取部分原始样本作为第一样本;获取新增的第二样本和所述第二样本的第二软标签;将所述第一样本和对应的所述第一软标签以及所述第二样本和对应的所述第二软标签作为训练样本;将所述训练样本输入所述基础目标模型中进行模型训练,以生成最终的目标模型。
根据本公开的第二方面,提出了一种模型的增量训练装置,包括第一获取模块,用于基于原始样本集训练出的基础目标模型,获取所述原始样本集中每个原始样本的第一软标签;选取模块,用于基于所述第一软标签,从所述原始样本集中选取部分原始样本作为第一样本;第二获取模块,用于获取新增的第二样本和所述第二样本的第二软标签;确定模块,用于将所述第一样本和对应所述第一软标签以及所述第二样本和对应的所述第二软标签作为训练样本;训练模块,用于将所述训练输入所述基础目标模型中进行模型训练,以生成最终的目标模型。
根据本公开的第三方面,提出了一种电子设备,包括存储器、处理器。所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现如本公开第一方面实施例所述的模型的增量训练方法。
根据本公开的第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于实现如本公开第一方面实施例所述的模型的增量训练方法。
根据本公开的第五方面,提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时以实现如本公开第一方面实施例所述的模型的增量训练方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例一种模型的增量训练方法的示意图;
图2是根据本公开实施例选取第一样本的方法的示意图;
图3是根据本公开实施例对选取样本去重的方法的示意图;
图4是根据本公开实施例一种模型的增量训练方法的流程示意图;
图5是根据本公开实施例一种模型的增量训练装置的示意图;
图6是根据本公开实施例一种电子设备的结构图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110258520.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多杆特选树拼栽方法
- 下一篇:定位图获取模型的训练方法和装置