[发明专利]一种基于深度学习的含噪声标签图像的分类方法有效
申请号: | 201810846627.7 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109034248B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 杨国武;秦晓明;何沂娟;陈祥;陈浩;鲁品肃 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/762;G06K9/62 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 马林中 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 噪声 标签 图像 分类 方法 | ||
本发明公开一种基于深度学习的含噪声标签图像的分类方法,涉及图像分类技术领域,本发明的方法包括如下步骤:步骤1,对语义元数据集和图像数据集进行数据提纯得到baseline数据集;步骤2,基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;步骤3,通过层次聚类对特征信息进行聚类,得到新的数据类别;步骤4,基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;步骤5,最后基于data数据集使用short_inception网络训练出最终的分类模型;步骤6,根据最终的分类模型对含噪声标签图像进行分类。本发明解决了现有的含噪声标签图像的分类方法无法适用于大数据集的问题。
技术领域
本发明涉及图像分类技术领域,尤其涉及一种基于深度学习的含噪声标签图像的分类方法。
背景技术
卷积神经网络(CNN)指的是一类用来处理具有已知网格状拓扑结构数据的深度学习算法,特指那些使用一种称作“卷积”运算的网络,其中卷积是一种特殊形式的线性运算,具体指在不止一层的网络层进行就地矩阵乘法。RNN是一种用于处理序列数据的深度学习算法,近些年来循环神经网络(RNN)成功应用于语音识别、机器翻译、语言模型等任务中,可以说是处理文本类数据的标配网络。层次聚类指的是通过合并或者分割数据集相继生成嵌套的类簇;主要的分类策略有两种:自上而下的分裂法和自下而上的集聚法。
半监督学习是监督学习和无监督学习相结合的一种学习方法,同时使用大量无标签数据和少量的有标签数据来进行学习,由于所需带标签数据比较少,只需要很少的时间和精力就可以获得一部分高精准的带标签数据,然后基于这部分高精准的带标签数据作为监督信号进行建模迭代分类,在某些分类任务中可以获得不错的效果,并且可以大大减少学习成本。但是缺陷也是显而易见的,由于具有高精度带标签的数据只有很少一部分,当带标签数据所占总体数据量过小(可能只是全部数据的千分之一、万分之一等),并且带标签的数据在总体数据中分布不均匀的时候,基于这部分带标签数据来对整个数据集建立好的模型,显然是不可能的。
发明内容
本发明的目的在于:为解决现有的含噪声标签图像的分类方法无法适用于大数据集的问题,本发明提供一种基于深度学习的含噪声标签图像的分类方法。
为解决上述问题,本发明的技术方案如下:
一种基于深度学习的含噪声标签图像的分类方法,包括如下步骤:
步骤1:对语义元数据集和图像数据集进行数据提纯得到baseline数据集;数据提纯的具体步骤包括获取词向量和图片向量、将这两个向量进行权值连接得到综合向量、将综合向量传入混合距离相似度算法中、最后计算得到各个数据的相似度;其中词向量为所有子词向量、词均值向量串联而成;
步骤2:基于baseline数据集训练baseline模型,通过训练好的baseline模型提取baseline数据集的特征信息;
步骤3:通过层次聚类对特征信息进行聚类,得到新的数据类别;
步骤4:基于新的数据类别对baseline数据集进行重新划分,得到分类数据集data;
步骤5:最后基于data数据集使用short_inception网络训练出最终的分类模型;short_inception网络结构包括输入层、三层s_inception块、全连接层fc和输出层,s_inception块与s_inception块之间使用了的短连接层short_cut,s_inception块包括输入层、卷积核、池化层和concat层;
步骤6:根据最终的分类模型对含噪声标签图像进行分类。
具体地,所述步骤1的具体步骤为:
步骤1.1:获取语义元数据集的n维词向量;获取图片数据的m维图片向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810846627.7/2.html,转载请声明来源钻瓜专利网。