[发明专利]模型训练方法、模型训练装置、计算机设备和存储介质有效
申请号: | 202110105101.5 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112765354B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 杨华;胡毅奇;刘云峰 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06V40/16;G06V10/774;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王学强 |
地址: | 518000 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例公开了模型训练方法、模型训练装置、计算机设备和存储介质,用于提高模型训练中无标签样本的利用价值。本申请实施例的方法包括:获取第一训练数据,所述第一训练数据为无标签的训练数据;对所述第一训练数据进行数据增广操作,得到第一增广数据;将所述第一训练数据与所述第一增广数据输入待训练模型进行无监督训练,计算所述第一训练数据与所述第一增广数据的分布差异;基于所述分布差异计算第一损失函数,所述第一损失函数的大小与所述分布差异的大小呈正相关。
技术领域
本申请实施例涉及机器学习领域,具体涉及模型训练方法、模型训练装置、计算机设备和存储介质。
背景技术
在机器学习领域中,训练一个模型,就需要工程师收集与待训练模型相匹配的训练数据。例如对于人脸识别模型,需要收集人脸数据,对于语义识别模型,则需要收集语义数据。因此,工程师在训练模型之前,需要先付出成本,获取大量与待训练模型匹配的训练数据。
通常渠道下获取的训练数据都是未添加标签的训练数据,需要专门为未添加标签的训练数据添加标签。然而,添加为训练数据添加标签的成本是比较高的,实际操作中,往往仅从大量的无标签训练数据中,筛选一些学习价值比较高的训练数据进行标签添加,剩余的无标签训练数据弃置不用,这就导致了剩余无标签训练数据的浪费。
发明内容
本申请实施例提供了一种模型训练方法,用于在模型训练的过程中,充分利用无标签的训练数据。
本申请第一方面提供一种模型训练方法,所述方法包括:
获取第一训练数据,所述第一训练数据为无标签的训练数据;
对所述第一训练数据进行数据增广操作,得到第一增广数据;
将所述第一训练数据与所述第一增广数据输入待训练模型进行无监督训练,计算所述第一训练数据与所述第一增广数据的分布差异;
基于所述分布差异计算第一损失函数,所述第一损失函数的大小与所述分布差异的大小呈正相关。
可选地,所述方法还包括:
获取第二训练数据,所述第二训练数据为有标签的训练数据;
将所述第二训练数据输入所述待训练模型进行有监督训练,以计算第二损失函数。
可选地,所述方法还包括:
获取有标签的第二训练数据;
对所述第二训练数据进行数据增广操作,得到第二增广数据,所述第二增广数据与所述第二训练数据的训练标签相同;
将所述第二训练数据与所述第二增广数据输入所述待训练模型进行有监督训练,以计算第二损失函数。
可选地,所述方法还包括:
根据所述第一损失函数和第二损失函数对所述待训练模型进行修正,得到目标训练模型。
可选地,所述方法还包括:
获取主动学习模型,所述主动学习模型用于将输入的训练数据分类为第一类数据和第二类数据;
获取无标签的训练数据;
将所述无标签的训练数据输入所述主动学习模型进行分类;
若所述无标签的训练数据为所述第一类数据,则将所述无标签的训练数据归类为第一训练数据。
可选地,若所述无标签的训练数据为所述第二类数据,则为所述无标签的训练数据增加标签,并将增加了标签的所述无标签的训练数据归类为第二训练数据。
可选地,所述待训练模型与所述主动学习模型的参数相同。
可选地,所述待训练模型为语义识别模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110105101.5/2.html,转载请声明来源钻瓜专利网。