[发明专利]图像分类方法,参数训练方法和图像分类装置在审
申请号: | 202110256627.3 | 申请日: | 2021-03-09 |
公开(公告)号: | CN115049869A | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 黄开竹;高志强;张锐;王秋锋;钟朝亮 | 申请(专利权)人: | 西交利物浦大学;富士通株式会社 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/44;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 张祥意;陶海萍 |
地址: | 215123 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 参数 训练 装置 | ||
本发明实施例提供一种图像分类方法和装置,参数训练方法,该图像分类方法包括:将输入图像数据输入分类器中,提取输入图像数据的特征向量,根据该特征向量对该输入图像数据进行分类,得到各输入图像数据对应的预测标签,并确定第一损失函数;该标签表示该输入图像数据所属的类别;该输入图像数据包括源域图像数据和目标域图像数据;判别器根据该特征向量的梯度判别该梯度对应的预测域标签是源域或目标域,并确定第二损失函数;根据该第一损失函数和该第二损失函数,训练并更新该分类器和该判别器的参数,直至该第一损失函数和该第二损失函数最优化;参数更新后的所述分类器对需要分类的输入图像数据进行分类,以得到所述需要分类的输入图像数据的分类结果。
技术领域
本发明涉及图像处理领域。
背景技术
图像分类是指从给定的分类集合中给图像分配一个标签的任务,也就是说该任务是分析一个输入图像并输出该图像分类的标签,该标签是来自预定义的可能类别集合,目前,深度学习在图像分类领域的应用已经全面超过了传统的机器学习,且单域的图像分类任务近来已经取得了巨大的进展,但是在跨域(cross domain)或者迁移(transfer)问题上却存在很大的困难,这是由于在传统的机器学习场景中,训练集和测试集具有相同的分布,因此,可以用训练集训练好的分类器直接用于测试集分类,但在跨域问题中,源域(sourcedomain)和目标域(target domain)通常具有不同的分布,这就意味着我们无法将源域训练好的分类器,直接用于目标域样本的分类。为了解决这一问题,目前提出了利用源域数据上的可用标签,通过领域自适应的学习方式,使得源任务和目标任务共享相同的标签空间,使得属于同一类(标签)的样本聚在一起。因此,就可以利用带标签的源域数据,训练分类器供目标域样本使用。
无监督领域自适应(UDA)是一种解决上述迁移问题的方法,其将分类模型从有标签的源域应用到无标签的目标域,目前无监督领域自适应的主要思路是对齐源域和目标域之间的分布。其中,UDA的目的是学习一个分类模型,以预测目标域的类别标签,通过最小化两个域间的分布差异来提升目标域上预测的准确率。在众多的无监督领域自适应方法中,领域对抗训练(DANN)学习方法在近期取得了优异的效果。该DANN模型引入了一个判别器,和分类模型一起进行对抗训练,判别器将分类模型提取的特征向量作为输入,并学习区分该特征向量是来自哪个域的,同时,分类模型中的特征提取器则学习去生成领域不变特征,即无法分辨出是哪个域的特征,去愚弄判别器。通过这种领域对抗训练学习方法得到的领域不变特征,可以大大减小两个域之间的分布差异,以使得在源域上学习的模型能够直接应用到目标域上。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
发明人发现,在现有基于对抗学习的无监督自适应方法中,可以利用对类别可判别的信息进行对抗学习,其中,该可判别的信息可以用于评估提取的特征是否可以用于判定数据属于哪个类别,但现有的方法中在确定可判别的信息时,仅考虑了分类器的输出(即分类结果),而没有考虑分类器输出和类别标签之间的差异,因此,仍然无法很好的减少源域和目标域之间存在分布差异。
针对上述问题中的至少之一,本发明实施例提供一种参数训练方法、图像分类方法和装置。
根据本发明实施例的第一方面,提供一种图像分类装置,其中,该装置包括:
分类器,其用于提取输入图像数据的特征向量,根据该特征向量对该输入图像数据进行分类,得到各输入图像数据对应的预测标签;该标签表示该输入图像数据所属的类别;该输入图像数据包括源域图像数据和目标域图像数据;
判别器,其用于根据该特征向量的梯度判别该梯度对应的预测域标签是源域或目标域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西交利物浦大学;富士通株式会社,未经西交利物浦大学;富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110256627.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序