[发明专利]域自适应中基于二分类器检测目标域相似类的方法在审
申请号: | 202010621074.2 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111832640A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 胡海峰;潘万顺;张进 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 陈栋智 |
地址: | 210003 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 基于 分类 检测 目标 相似 方法 | ||
本发明提出了一种域自适应中基于二分类器检测目标域相似类的方法,包括以下步骤:步骤1:使用源域样本对特征提取器和多二进制分类器进行训练;步骤2:在特征空间上训练对抗生成对齐网络,使目标域样本对齐源域样本;步骤3:观察目标域样本在多二进制分类器上的输出,找出相似的类,同时用TSNE进行降维来验证找到的相似的类;步骤4:利用现有的距离度量学习算法,在度量空间中拉开源域中相似类的距离,然后重新让目标域对齐源域,从而间接拉开了目标域相似类之间的距离,本发明以方便直观可靠的方法找到目标域中相似的类,然后在度量空间上加大相似类之间的距离,以便分类器能准确分类降低误差。
技术领域
本发明涉及一种检测目标域相似类的方法,具体的说是一种域自适应中基于二分类器检测目标域相似类的方法,属于人工智能技术领域。
背景技术
随着人工智能和机器学习的不断发展,深度学习受到越来越多的重视,深层神经网络的发展提高了计算机视觉任务的性能,然而这种性能的提升需要大量的带有标记的数据,这在实际中往往很难实现。当大量的标记数据缺失的情况下,只有采取域自适应的方法来解决这个问题。域自适应是迁移学习中很重要的一部分内容,目的是把分布不同的源域和目标域的数据,映射到一个特征空间中,使其在该空间中的距离尽可能近,提高目标域上的分类准确率。
域自适应方法需要源域有标记,即在源域上是有监督学习。监督学习,是一类机器学习中的算法,可以由训练资料中学到或建立一个模式,并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签。机器学习中还有一大类算法,叫做非监督学习,是直接对没有标记的训练数据进行建模学习,注意在这里的数据是没有标记的数据,与监督学习的最基本的区别是建模的数据一个有标签一个是没有标签的。相比于非监督学习,监督学习的优点就是可以充分利用已知的标记信息,融合更多信息到构建的模型中,有效增加模型的可靠性。
但是,域自适应并没有非常好地解决目标域相似类距离接近的问题,这一问题造成部分目标域样本经过域自适应后依然没有分类准确。目标域经过域自适应后,往往有些目标域样本处于特征空间某两类的决策边界,这就造成一些目标域样本被错误地划分为另一类中了。现有技术中对于如何检测目标域相似类并在度量空间上拉开问题尚没有公开的披露。
发明内容
本发明的目的是提供一种域自适应中基于二分类器检测目标域相似类的方法,以方便直观可靠的方法找到目标域中相似的类,然后在度量空间上加大相似类之间的距离,以便分类器能准确分类降低误差。
本发明的目的是这样实现的:一种域自适应中基于二分类器检测目标域相似类的方法,包括以下步骤:
步骤1:使用源域样本对特征提取器和多二进制分类器进行训练;
步骤2:在特征空间上训练对抗生成对齐网络,使目标域样本对齐源域样本;
步骤3:观察目标域样本在多二进制分类器上的输出,找出相似的类,同时用TSNE进行降维来验证找到的相似的类;
步骤4:利用现有的距离度量学习算法,在度量空间中拉开源域中相似类的距离,然后重新让目标域对齐源域,从而间接拉开了目标域相似类之间的距离。
作为本发明的进一步限定,步骤1中训练时损失函数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010621074.2/2.html,转载请声明来源钻瓜专利网。