[发明专利]一种模型的增量训练方法和装置在审
申请号: | 202110258520.2 | 申请日: | 2021-03-09 |
公开(公告)号: | CN113033631A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 刘晨晖;钟辉强;黄强;徐思琪;周厚谦 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 增量 训练 方法 装置 | ||
1.一种模型的增量训练方法,包括:
基于原始样本集训练出的基础目标模型,获取所述原始样本集中每个原始样本的第一软标签;
基于所述第一软标签,从所述原始样本集中选取部分原始样本作为第一样本;
获取新增的第二样本和所述第二样本的第二软标签;
将所述第一样本和对应的所述第一软标签以及所述第二样本和对应的所述第二软标签作为训练样本;
将所述训练样本输入所述基础目标模型中进行模型训练,以生成最终的目标模型。
2.根据权利要求1所述的方法,其中,所述基于所述第一软标签,从所述原始样本集中选取部分原始样本作为第一样本,包括:
针对每个类别,基于所述第一软标签携带所述类别的识别概率,对所述原始样本进行分组,生成所述类型对应的样本组;
从每个所述样本组中选取部分原始样本,作为所述类型对应的选中原始样本;
将每个所述类型对应的选中原始样本,作为所述第一样本。
3.根据权利要求2所述的方法,其中,所述将每个所述类型对应的选中原始样本,作为所述第一样本,包括:
响应于所述选中原始样本中存在重复的原始样本,对所述选中原始样本进行去重处理;
将所述去重后剩余的选中原始样本,作为所述第一样本。
4.根据权利要求3所述的方法,其中,所述方法还包括:
获取被去重的所述选中原始样本所属的分组,并从所述所属的分组中重新选取相异的原始样本,作为替代原始样本;
基于所述替代原始样本对所述第一样本进行补充。
5.根据权利要求1-4任一项所述的方法,其中,所述方法还包括:
获取所述第二样本的样本数量,并按照所述样本数量,从所述原始样本集中选取所述第一样本。
6.根据权利要求1-4任一项所述的方法,其中,所述方法还包括:
获取所述第二样本的硬标签,并对所述硬标签进行转换,生成所述第二软标签。
7.一种模型的增量训练装置,包括:
第一获取模块,用于基于原始样本集训练出的基础目标模型,获取所述原始样本集中每个原始样本的第一软标签;
选取模块,用于基于所述第一软标签,从所述原始样本集中选取部分原始样本作为第一样本;
第二获取模块,用于获取新增的第二样本和所述第二样本的第二软标签;
确定模块,用于将所述第一样本和对应所述第一软标签以及所述第二样本和对应的所述第二软标签作为训练样本;
训练模块,用于将所述训练输入所述基础目标模型中进行模型训练,以生成最终的目标模型。
8.根据权利要求7所述的装置,其中,所述选取模块,还用于:
针对每个类别,基于所述第一软标签携带所述类别的识别概率,对所述原始样本进行分组,生成所述类型对应的样本组;
从每个所述样本组中选取部分原始样本,作为所述类型对应的选中原始样本;
将每个所述类型对应的选中原始样本,作为所述第一样本。
9.根据权利要求8所述的装置,其中,所述选取模块,还用于:
响应于所述选中原始样本中存在重复的原始样本,对所述选中原始样本进行去重处理;
将所述去重后剩余的选中原始样本,作为所述第一样本。
10.根据权利要求9所述的装置,其中,所述选取模块,还用于:
获取被去重的所述选中原始样本所属的分组,并从所述所属的分组中重新选取相异的原始样本,作为替代原始样本;
基于所述替代原始样本对所述第一样本进行补充。
11.根据权利要求7-10任一项所述的装置,其中,所述选取模块,还用于:
获取所述第二样本的样本数量,并按照所述样本数量,从所述原始样本集中选取所述第一样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110258520.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多杆特选树拼栽方法
- 下一篇:定位图获取模型的训练方法和装置