[发明专利]基于类一致性结构化学习的跨域图像分类方法和相关装置有效
申请号: | 202111530728.1 | 申请日: | 2021-12-15 |
公开(公告)号: | CN113920382B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 陆玉武;罗幸萍;林德伟 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06K9/62 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 梁立耀 |
地址: | 518060 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 一致性 结构 化学 图像 分类 方法 相关 装置 | ||
本申请实施例公开了一种基于类一致性结构化学习的跨域图像分类方法、装置、电子设备及计算机可读存储介质。该方法包括:基于使用源域数据训练的第一图像分类器,获得目标域样本的初始化伪标签,并基于初始化伪标签和源域的标签,获得初始化的投影矩阵、图矩阵、类别权重矩阵、源域的拉普拉斯矩阵及目标域的拉普拉斯矩阵,再使用初始化得到的矩阵对投影矩阵进行更新,并使用更新后的投影矩阵进行投影学习,以对初始化伪标签进行更新,最后在循环次数达到预设次数时,将更新后的伪标签作为目标域样本图像的最终分类结果。可见,通过学习同类别中源域到目标域的拉普拉斯矩阵,提高类内样本的一致性和连续性,以提高模型对目标域样本的分类性能。
技术领域
本申请属于机器学习技术领域,尤其涉及一种基于类一致性结构化学习的跨域图像分类方法、装置、电子设备及计算机可读存储介质。
背景技术
无监督域适应(Domain Adaptation)是指在含有标签的源域训练出一个模型应用于无标签的目标域的一种机器学习方法。
含有标签的源域数据集和不含标签的目标域数据集可能存在着数据分布差异(边缘分布差异和条件分布差异),进而导致在源域训练好的模型应用于目标域时,模型的性能可能出现明显地下降(“过拟合”)。为了缓解源域和目标域之间的数据分布差异,传统无监督域适应方法可以采用基于特征适应的方法,例如,迁移成分分析(Transfer ComponentAnalysis,TCA)和联合分布适应(Joint Distribution Adaptation,JDA);也可以采用基于实例权重的方法,例如,迁移联合匹配方法(Transfer Joint Matching,TJM)和偶合知识迁移方法(Coupled Knowledge Transfer,CKET)。
为了克服源域和目标域的数据分布差异,目前用于处理图像分类的大多数无监督域适应方法引入了边缘分布匹配和条件分布匹配。样本数据经过边缘分布匹配和条件分布匹配后,会出现处于不同域的同一类别的样本点分布疏散的情况,即不同域的类内样本分布疏散,一致性和连续性较差。相同类别的样本簇分布疏散可能极大地降低了模型对目标域样本的分类性能。
发明内容
本申请实施例提供一种基于类一致性结构化学习的跨域图像分类方法、装置、电子设备及计算机可读存储介质,可以解决现有无监督域适应方法中由于类内样本一致性和连续性较差,导致模型对目标域样本的分类性能低下的问题。
第一方面,本申请实施例提供一种基于类一致性结构化学习的跨域图像分类方法,包括:
获取源域数据集和目标域数据集,源域数据集包括源域样本图像和源域样本图像的标签,目标域数据集包括目标域样本图像;
基于使用源域数据集训练的第一图像分类器,获得各个目标域样本图像的初始化伪标签;
将源域数据集和目标域数据集投影至同一公共空间,获得源域样本点和目标域样本点,并基于初始化伪标签和标签,根据同一类别的源域样本点和目标域样本点进行初始化,获得投影矩阵、图矩阵、类别权重矩阵、源域的拉普拉斯矩阵及目标域的拉普拉斯矩阵;
根据图矩阵、类别权重矩阵、源域的拉普拉斯矩阵及目标域的拉普拉斯矩阵,对投影矩阵进行更新,获得更新后的投影矩阵;
使用更新后的投影矩阵对源域数据集和目标域数据集进行投影学习,获得投影后的源域样本数据和投影后的目标域样本数据;
基于使用带标签的投影后的源域样本数据训练的第二图像分类器,对投影后的目标域样本数据进行分类,获得投影后的目标域样本数据的伪标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111530728.1/2.html,转载请声明来源钻瓜专利网。