[发明专利]一种基于多专家系统和知识蒸馏的众包图像学习方法有效
申请号: | 202210205861.8 | 申请日: | 2022-03-04 |
公开(公告)号: | CN114299349B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 李绍园;侍野 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 青岛锦佳专利代理事务所(普通合伙) 37283 | 代理人: | 朱玉建 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 专家系统 知识 蒸馏 图像 学习方法 | ||
本发明属于图像标注技术领域,公开了一种基于多专家系统和知识蒸馏的众包图像学习方法,该方法包括:步骤1.获取图像数据,并构造众包标注集;步骤2.使用图像集和众包标注集训练一个深度众包学习模型;步骤3.使用步骤2得到的模型生成第一真实标记预测;步骤4.使用图像集和第一真实标记预测训练一个无噪声建模的噪声标记学习模型;步骤5.使用步骤4得到的模型生成第二真实标记预测;步骤6.使用第二真实标记预测、图像集和众包标注集重新训练一个深度众包学习模型;步骤7.使用步骤4和步骤6的模型预测标记未知图像的真实标记。本发明将深度众包学习方法与无噪声建模的噪声标记学习方法结合,提升了分类器模型图像标记的预测效果。
技术领域
本发明属于图像标注技术领域,涉及一种基于多专家系统和知识蒸馏的众包图像学习方法。
背景技术
传统的监督学习需要大量的高质量标记数据,这需要较高的标注成本。为了降低成本,人们提出了多种方法,如众包学习。众包学习的流程是将图像集随机分发给网络平台上的标注者进行标注,为了提升标注质量,单张图像往往会由若干个标注者进行标注。由于标注者各自的能力水平参差不齐,众包标记学习方法往往需要刻画标注者的能力水平,而噪声转移矩阵是一类常用的刻画工具。然而,由于噪声转移矩阵假设噪声标记的生成过程只依赖于样本的真实标记,该假设过于简化,无法刻画真实的众包标记中存在的部分错误模式,此外,噪声转移矩阵的估计往往存在一定偏差,这也会影响众包标记学习模型的泛化性能。
噪声标记问题假设单张图像对应单个可能错误的标记。近年来,噪声标记学习方法与深度神经网络结合,并发现深度神经网络将会首先拟合噪声标记中(简单)正确的模式,再去拟合其中(复杂)错误的模式,这也被成为记忆效应。研究者们根据此现象,认为网络损失值更小的标记更有可能正确,从而筛选出质量较高的标记信息。同时,这些方法将被认为是标记错误的图像视为无标记数据,同时利用半监督或自监督学习技术结合来利用这些数据,最近取得了非常显著的成功。由于此类方法并没有对噪声标记的结构显式建模,它们又可以被成为无噪声建模的噪声标记学习方法。
发明内容
本发明的目的在于提出一种基于多专家系统和知识蒸馏的众包图像学习方法,以缓解原有深度众包学习方法对于众包标注中噪声信息的过度拟合,提升分类器模型的泛化性能。
本发明为了实现上述目的,采用如下技术方案:
基于多专家系统和知识蒸馏的众包图像学习方法,包括如下步骤:
步骤1.获取图像集X,将图像集X随机分发给标注者进行标注,获得众包标注集
步骤2.将图像集X和众包标注集作为训练集,训练一个深度众包学习模型h0;
步骤3.使用训练好的深度众包学习模型h0,生成第一真实标记预测
步骤4.将图像集X和第一真实标记预测作为训练集,训练一个无噪声建模的噪声标记学习模型h1;
步骤5.使用训练好的无噪声建模的噪声标记学习模型h1,生成第二真实标记预测
步骤6.将图像集X、众包标注集第二真实标记预测作为训练集,重新训练一个深度众包学习模型h2;
步骤7.对于未知图像,使用步骤4得到的无噪声建模的噪声标记学习模型h1以及步骤6得到的深度众包学习模型h2,预测标记未知图像的真实标记。
本发明具有如下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210205861.8/2.html,转载请声明来源钻瓜专利网。