[发明专利]一种基于特征共享的自学习迁移方法在审
申请号: | 202110362608.9 | 申请日: | 2021-04-02 |
公开(公告)号: | CN112990340A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 王轶默;刘剑;许一航;薛磊;柳文章 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 许小莉 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 共享 自学习 迁移 方法 | ||
本发明公开了一种基于特征共享的自学习迁移方法,该方法包括如下步骤:步骤一:采用卷积神经网络作为卷积自编码器,在卷积自编码器的编码特征后面加入一个nonlocal模块,nonlocal模块包括四个卷积层和一个softmax层,采用softmax作为分类器;步骤二:选择由无标签数据构成的数据集A和由有标签数据构成的数据集B,将数据集B划分为训练集和测试集;步骤三:用数据集A训练自编码器,训练好后,将自编码器中的编码部分提取出来,当做特征提取器,连接到一个分类器C1中,利用数据集B中划分的训练集训练新的分类器C2,最终数据集A训练的特征提取器与数据集B训练的分类器的组合就是本方法的分类模型;步骤四:测试。本发明可有效拓展现有医学图像分类方法的适用范围。
技术领域
本发明属于机器学习领域,具体涉及一种基于特征共享的自学习迁移方法。
背景技术
在传统机器学习的框架下,分类学习的任务就是训练一个分类模型使其在训练数据集上最小化经验损失,并且在测试数据集上有较好的分类能力。一般而言,一个泛化能力较强的分类模型需要对每个应用场景都标定大量训练数据,这将会耗费大量的人力与物力。实际应用中,我们能轻松获得大量无标签数据(比如从网上随机下载海量图片);而获得大量有标签数据往往代价很高,尤其是医学影像数据。目前,利用无标签数据进行医学图像分类的常用方法包括以下三种:无监督学习、半监督学习、迁移学习,这几种方法的主要特点如下:
无监督学习:无监督学习不使用传统分类标签,利用旋转角度等易于获取的信息,引导特征提取网络挖掘医学图像内部不同像素点潜在的结构关联。在只有特征、没有标签的训练数据集中,通过数据之间的内在联系和相似性将他们分成若干类。该方法所提取的特征虽具有一定程度的泛化能力,但特征的区分度有限,不适合医学图像分类。
半监督学习:半监督学习利用少部分的标记数据集和大量无标记的数据集训练分类器。虽然该类方法能在一定程度上减少分类器训练过程中对大量标记样本的依赖,但训练分类器时对标记和非标记样本有额外要求,即参与训练的标记和非标记样本应来自相同应用场景。这限制了此类方法的应用范围。在医学图像处理中,不同病灶的无标记样本间可能存在潜在关联,而现有的半监督学习算法无法通过利用该关联性提升性能。因此,直接用已有的非目标病灶无标签数据训练目标病灶的分类器,将会大大降低算法的分类效果。
迁移学习:迁移学习的目标是将源域中学到的知识迁移到目标域中,使得算法在目标域中的性能得以提升。具体而言,迁移学习通常选取两个数据集:数据集A和数据集B。源域对应数据集A,目标域对应数据集B。迁移学习实际上是利用源域与目标域知识的关联性(迁移学习中的知识主要指样本分布、样本特征等信息),学习特征映射函数,将源域样本特征映射到目标域的样本特征空间中。这样的好处是可以在目标域中更好地利用源域已有的标记数据样本对分类器进行训练。
如何有效利用不同类型无标签病灶图片训练分类器,拓展现有医学图像分类方法的适用范围是医学影像数据中需要解决的问题。
发明内容
发明目的:针对上述存在的问题,本发明提出了一种基于特征共享的自学习迁移方法,结合了自监督学习与迁移学习各自优势,其具体训练步骤步骤包括两部分:首先利用无标签数据来训练特征提取器;其次,在新的应用场景中,通过少量有标签数据训练分类器。所提出方法与传统迁移学习最大的不同,在于其有效利用卷积自编码器跨域训练分类模型中的特征提取器(分类模型中的特征提取器和分类器两部分可分别在两个样本分布不相似的数据集下训练)。这样,可有效利用不同类型无标签病灶图片训练分类器,拓展现有医学图像分类方法的适用范围。
上述的目的通过以下技术方案实现:
一种基于特征共享的自学习迁移方法,包括如下步骤:
步骤一:网络建模
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110362608.9/2.html,转载请声明来源钻瓜专利网。