[发明专利]基于类别级软目标监督的细粒度图像分类模型训练方法在审
申请号: | 202310352190.2 | 申请日: | 2023-04-04 |
公开(公告)号: | CN116563602A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 梅建萍;褚鑫凯 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/74;G06V10/40;G06N3/098 |
代理公司: | 杭州赛科专利代理事务所(普通合伙) 33230 | 代理人: | 余华康 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 类别 目标 监督 细粒度 图像 分类 模型 训练 方法 | ||
本发明涉及基于类别级软目标监督的细粒度图像分类模型训练方法,以有标签的数据预训练一目标模型;以目标模型的参数初始化EMA模型,根据EMA模型中全连接层的参数计算一相似度矩阵,基于相似度矩阵获得类别级软标签,与图像进行关联;输入图像,基于目标模型和EMA模型构建模型训练的总损失更新目标模型;以新的目标模型更新EMA模型,并用新EMA模型计算出新的类别级软标签;重复并最小化总损失,实现细粒度图像分类模型的训练。本发明能在面对细粒度图像分类的问题上取得良好的效果,既保留了类别之间的关系,也不需要额外的空间储存预训练模型,不需要复杂的聚类过程,也不需要额外的预训练模型来获取软标签;准确率高。
技术领域
本发明涉及计算;推算或计数的技术领域,特别涉及一种基于类别级软目标监督的细粒度图像分类模型训练方法。
背景技术
图像分类是计算机视觉分类领域的一个经典问题,其目标是将不同的图像划分到不同的类别。近年来,深度神经网络在视觉分类领域取得了非常不错的应用效果,已经成为解决计算机视觉领域众多机器学习任务的首选建模工具,尤其在监督模式下训练的大规模神经网络在图像分类任务中取得了明显优于其他传统模型的泛化能力。在过去几年中,深度神经网络推动图像分类取得了很大的进步,但是常见的图像分类集中的类别的粒度仍然较粗,比如,狗这个类别下,还可以细分为拉布拉多犬、金毛寻回犬、边境牧羊犬等细分类别,这就导致了在一些网络中对于这些图像的分类效果不佳。粗粒度的分类已经越来越无法满足实际生产生活的需要,而细粒度图像的分类就是针对这类问题继续的研究。
近年来,细粒度图像分类无论在工业界还是学术界都有着广泛的研究需求与应用场景。对比普通的图像分类问题,细粒度分类面对的图像数据具有更加相似的外观特性。由于分类的粒度很小,细粒度图像分类非常困难,在某些类别上甚至专家都难以区分。主要原因有三点:1.子类之间差异细微:只在某个局部上有细微差异;2.子类内部差异巨大;3.受视角、背景、遮挡等因素影响较大。这些困难令细粒度图像分类成为一项极具挑战的研究任务。在实际生活中,识别不同的子类别又存在着巨大的应用需求。例如,在生态保护中,有效识别不同种类的生物是进行生态研究的重要前提,如果能够借助于计算机视觉的技术实现低成本的细粒度图像识别,那么无论对于学术界还是工业界而言,都有着非常重要的意义。
针对以上问题需要对类别之间的关系进行建模,用于模型训练,而由于硬标签的one-hot的特性,不适用于细粒度图像之间的区分,因此提出了软标签的概念。硬标签和软标签的不同在于,硬标签对于分类结果不是1就是0,而软标签对于分类结果是根据每个类别对应的概率给出一个不那么确定的标签,这就让类别之间有了更多的关联和信息,可以让模型学习到更多的知识。Label Smoothing是一种获得软标签的方法,但是有效性不够,由于其只是单纯的添加随机噪声,也无法反映标签之间的关系,因此对模型的提升有限,甚至有欠拟合的风险。另一种是通过额外的预训练模型来获取软标签,但是会需要额外的空间来储存预训练模型,这就造成了空间的浪费,所以其有效性也不足。
发明内容
本发明解决了现有技术中存在的问题,提供了一种基于类别级软目标监督的细粒度图像分类模型训练方法。
本发明所采用的技术方案是,一种基于类别级软目标监督的细粒度图像分类模型训练方法,所述方法以有标签的数据预训练一目标模型;以目标模型的参数初始化EMA模型,根据EMA模型中全连接层的参数计算一相似度矩阵,基于相似度矩阵获得类别级软标签tClu,与图像进行关联;
输入图像,基于目标模型和EMA模型构建模型训练的总损失更新目标模型;以新的目标模型更新EMA模型,并用新EMA模型计算出新的类别级软标签;重复并最小化总损失,实现细粒度图像分类模型的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310352190.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轮胎内壁清洗机
- 下一篇:一种多源数据融合语音室内定位方法及相关设备