[发明专利]一种基于知识蒸馏的多跨域少样本分类方法有效
申请号: | 202110931565.1 | 申请日: | 2021-08-13 |
公开(公告)号: | CN113610173B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 冀中;倪婧玮;刘西瑶 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 蒸馏 多跨域少 样本 分类 方法 | ||
一种基于知识蒸馏的多跨域少样本分类方法,利用知识蒸馏中师生网络的框架进行有效知识的迁移,从而使模型具有更好的泛化能力。本发明将元学习的训练策略引入知识蒸馏中,通过面向任务的知识蒸馏和多个教师网络之间的协作,不仅向学生网络提供了丰富且有效的知识,而且保证了学生网络对少样本任务的快速适应能力。通过引入多层次知识蒸馏,分别提取教师网络的输出预测和样本关系作为监督信息,从不同角度指导学生网络的训练,使得知识蒸馏的效率更高。由此,本发明能够将有效的知识更好地从多个源域迁移到目标域上,提高学生网络在目标少样本任务上的分类准确率。
技术领域
本发明涉及一种少样本分类方法。特别是涉及一种基于知识蒸馏的多跨域少样本分类方法。
背景技术
目前,深度学习在计算机视觉领域已经取得了较大成功,例如物体分类、图像检索和动作识别等任务。深度学习的成功在很大程度上依赖于海量的数据和强大的计算资源。而许多认知学和心理学证据表明,人类往往可以从很少的例子中识别出新的视觉概念,这种快速学习的能力是现在的深度学习所不具备的。因此,如何通过有限的标记数据来学习识别新类别引起了人们的广泛关注,这也是少样本学习(Few-Shot Learning)所要解决的问题。近几年来,大量少样本学习的工作都采用了元学习(Meta Learning)的思想,其中基于度量的方法因其简单性和有效性而被广泛使用。这一类方法的模型结构主要包括两部分:特征编码器和度量函数。给定一个少样本任务,包含少量带标记的图像(支持集)和一些未标记的图像(查询集),特征编码器首先提取所有的图像特征,然后度量函数对标记图像和未标记图像的特征相似度进行计算,并预测查询图像的对应类别。
在基于元学习的少样本学习中,往往需要借助于一个包含大量标记数据的辅助数据集,这个数据集的类别与测试集相关但不相交。元学习的思想就是在辅助数据集上采样大量的少样本任务来训练模型,使其积累经验,从而能够快速适应新的少样本任务。然而,在某些现实场景中,例如医学、军事和金融等领域,存在数据获取困难和标记成本高等问题,无法获取包含相关类别的辅助数据集。这种情况下,只能使用来自其他领域的标记数据来训练模型以提供先验知识。由于辅助数据集和测试集的类别不相关,就不可避免地产生了域偏移问题,也严重损害了模型在测试集上的性能。因此,提高模型在不同领域之间的泛化能力成为少样本学习的一个重要挑战,也称为跨域少样本学习(Cross-Domain Few-ShotLearning)。具体来说,这个问题可以描述为在不使用目标域数据的情况下,借助其他域的辅助数据集训练模型,最终在目标域上很好的完成少样本分类任务。跨域问题也可以看做是一种知识迁移的问题,其目的是将有用的知识从辅助数据集传递到目标数据集上,保证模型在新的少样本任务上的分类性能。
由于深度学习模型的性能通常会随着可用数据的增加而提高,因此对跨域少样本学习来说,一种直观且简单的假设是,少样本学习模型应该充分利用不同任务和不同域中的数据来积累更多的经验。这一研究方向也被称为多跨域少样本学习(Multiple Cross-Domain Few-Shot Learning)。在这种设置下,辅助数据集包含了许多不同的领域,每个领域都由不同的源数据集表示。此时,另一个需要考虑的问题就是域之间的相关性对模型的影响。不同域数据的特征分布可能会有交叉重叠,也可能完全不相交。利用不相关的域可能对模型产生负面影响,带来知识干扰的问题。这就意味着,简单地混合多个域的标记数据来训练模型是不可行的,还必须探索如何利用或忽略从不同领域学到的知识,实现模型在目标域上的泛化和避免跨域干扰的问题。
发明内容
本发明所要解决的技术问题是,提供一种能够将有效的知识更好地从多个源域迁移到目标域上的基于知识蒸馏的多跨域少样本分类方法。
本发明所采用的技术方案是:一种基于知识蒸馏的多跨域少样本分类方法,其特征在于,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110931565.1/2.html,转载请声明来源钻瓜专利网。