[发明专利]模型训练方法、可读介质和电子设备有效
申请号: | 202111657195.3 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114972725B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 傅蓉蓉;徐晓忻;黄全充;徐强;纪荣嵘;周奕毅;曹刘娟 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06N3/091;G06N3/0895;G06N3/0464 |
代理公司: | 上海音科专利商标代理有限公司 31267 | 代理人: | 夏峰 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 可读 介质 电子设备 | ||
本申请涉及一种模型训练方法、可读介质和电子设备。该方法包括:采用第一样本集合对第一模型进行训练得到第二模型,其中第一样本集合包括A%的有标签样本和B%的伪标签样本;将C%的无标签样本输入第二模型,得到对应各无标签样本的模型输出结果;从C%的无标签样本中选择出模型输出结果满足预设条件的D%的无标签样本;利用第二样本集合对第二模型进行训练得到第三模型,其中,第二样本集合包括将D%的无标签样本标注后的D%的有标签样本、A%的有标签样本、E%的伪标签样本。本申请的技术方案通过合理选取模型训练所使用的有标签样本,可以提升训练得到的模型的目标检测能力。
技术领域
本申请涉及机器学习领域,特别涉及一种模型训练方法、可读介质和电子设备。
背景技术
在自动驾驶、智慧交通、安防、工业质检等业务领域,计算机视觉目标检测(Objectdetection,OD)任务的应用占比很高。要实现高质量的目标检测任务,就需要使用目标检测精度较高的神经网络模型来进行目标检测。
为了使用于实现目标检测功能的神经网络模型(以下简称模型)具有较好的目标检测性能,在对模型进行训练时,需要机器学习领域的人类专家来对训练所用的样本集中的所有图像中的所有目标(例如图像中的人、车辆等)进行标注,得到正确的标签。不难理解,使用具有正确标签的样本集来对前述模型进行训练,所训练出来的模型能够准确识别出待识别的图像中的目标,模型的检测精度较高。但是上述采用人类专家对训练所使用的样本集中所有图像中的目标进行标注的方式效率低,且标注成本较高。
通常为了提高模型训练效率,可以降低样本集中的标注量。而半监督学习(semi-supervised learning,SSL)作为一种常用的降低样本集中的标注量的机器学习技术,得到广泛应用。
参考图1A,半监督学习技术首先需要人类专家对样本集中的部分图像进行目标标注,得到F%的有标签样本,然后利用这F%的有标签样本和剩余的所有无标签样本一起对模型进行训练,直至达到预设训练目标。然而,通常半监督学习技术中的部分有标签样本的选取是随机的,也即随机选取样本集中的部分图像,并且对该部分图像进行人工标注,得到有标签样本。这就有可能会导致随机选取的有标签样本来对模型进行训练后,模型的性能较差。例如,期望训练后得到的模型能够准确识别出图像中的人和车辆这两类目标,然而前述随机选取的部分图像中不存在人和车辆这两类目标,导致采用训练后的模型进行图像目标检测时,无法准确识别出人和车辆这两类目标。
因此,在模型训练过程中,如何选取参与训练的有标签样本,对训练后得到的模型的性能和训练的效率影响较大。
发明内容
有鉴于此,本申请实施例提供了一种模型训练方法、可读介质和电子设备。本申请的技术方案采用伪标签样本和有标签样本构成的样本集对第一模型训练后得到的第二模型,将无标签样本输入第二模型后得到的模型输出结果进行评分,选出满足条件的样本,将标注后得到的新的有标签样本、训练第一模型时使用的有标签样本、剩余的无标签样本对第二模型进行训练,从而得到第三模型。由于训练第二模型时使用了大量的无标签样本,并且第二模型是经过有标签样本和大量无标签样本进行训练后得到的,具有较强的目标检测能力,因此基于第二模型的模型输出结果选出的样本较为准确,有助于提升第三模型的目标检测能力。且本申请技术方案无需模型训练和人工标注多次交替进行,可以提升模型训练效率。
第一方面,本申请实施例提供了一种模型训练方法,用于电子设备,包括:
采用第一样本集合对第一模型进行训练得到第二模型,其中第一样本集合包括A%的有标签样本和B%的伪标签样本,其中B%的伪标签样本是第一模型对C%的无标签样本进行预测得到的,并且B%小于或者等于C%;
将C%的无标签样本输入第二模型,得到对应各无标签样本的模型输出结果;
从C%的无标签样本中选择出模型输出结果满足预设条件的D%的无标签样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111657195.3/2.html,转载请声明来源钻瓜专利网。