[发明专利]模型训练方法、模型训练装置、计算机设备和存储介质有效

申请号：	202110105101.5	申请日：	2021-01-26
公开（公告）号：	CN112765354B	公开（公告）日：	2023-04-07
发明（设计）人：	杨华;胡毅奇;刘云峰	申请（专利权）人：	深圳追一科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F40/30;G06V40/16;G06V10/774;G06N20/00
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王学强
地址：	518000 广东省深圳市南山区粤海街道***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型训练方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了模型训练方法、模型训练装置、计算机设备和存储介质，用于提高模型训练中无标签样本的利用价值。本申请实施例的方法包括：获取第一训练数据，所述第一训练数据为无标签的训练数据；对所述第一训练数据进行数据增广操作，得到第一增广数据；将所述第一训练数据与所述第一增广数据输入待训练模型进行无监督训练，计算所述第一训练数据与所述第一增广数据的分布差异；基于所述分布差异计算第一损失函数，所述第一损失函数的大小与所述分布差异的大小呈正相关。

技术领域

本申请实施例涉及机器学习领域，具体涉及模型训练方法、模型训练装置、计算机设备和存储介质。

背景技术

在机器学习领域中，训练一个模型，就需要工程师收集与待训练模型相匹配的训练数据。例如对于人脸识别模型，需要收集人脸数据，对于语义识别模型，则需要收集语义数据。因此，工程师在训练模型之前，需要先付出成本，获取大量与待训练模型匹配的训练数据。

通常渠道下获取的训练数据都是未添加标签的训练数据，需要专门为未添加标签的训练数据添加标签。然而，添加为训练数据添加标签的成本是比较高的，实际操作中，往往仅从大量的无标签训练数据中，筛选一些学习价值比较高的训练数据进行标签添加，剩余的无标签训练数据弃置不用，这就导致了剩余无标签训练数据的浪费。

发明内容

本申请实施例提供了一种模型训练方法，用于在模型训练的过程中，充分利用无标签的训练数据。

本申请第一方面提供一种模型训练方法，所述方法包括：

获取第一训练数据，所述第一训练数据为无标签的训练数据；

对所述第一训练数据进行数据增广操作，得到第一增广数据；

将所述第一训练数据与所述第一增广数据输入待训练模型进行无监督训练，计算所述第一训练数据与所述第一增广数据的分布差异；

基于所述分布差异计算第一损失函数，所述第一损失函数的大小与所述分布差异的大小呈正相关。