[发明专利]一种基于元学习的细粒度分类方法在审
申请号: | 201811451465.3 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109711433A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 陆生礼;庞伟;阮小千;范雪梅;武瑞利;向丽苹;梁彪 | 申请(专利权)人: | 东南大学;东南大学—无锡集成电路技术研究所;南京三宝科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 葛潇敏 |
地址: | 214135 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 细粒度分类 测试集 训练集 彩色图片 外部数据 样本类别 样本 测试 分类效果 快速生成 数据集中 数据增强 损失函数 初始化 大数据 数据集 验证集 微调 相交 输出 通用 学习 分类 网络 | ||
1.一种基于元学习的细粒度分类方法,其特征在于包括如下步骤:
步骤1,根据研究机构的公开细粒度分类数据库或自行搜集的数据建立外部数据集,将数据集分为训练集、验证集和测试集,且测试集的样本类别小于训练集,训练集、验证集和测试集之间的样本类别互不相交;
步骤2,对数据集中的样本进行数据增强;
步骤3,建立卷积神经网络,该卷积神经网络的输入为彩色图片,输出为彩色图片所属类别,分类层的长度等于外部数据集的类别数,损失函数采用softmax loss;采用训练集训练细粒度分类网络;
步骤4,利用测试集对步骤3预训练好的卷积神经网络进行测试,并根据测试结果对卷积神经网络进行微调。
2.如权利要求1所述的一种基于元学习的细粒度分类方法,其特征在于:所述步骤1中,细粒度分类数据库选择Caltech-UCSD Brids 200数据集或者DogNet。
3.如权利要求1所述的一种基于元学习的细粒度分类方法,其特征在于:所述步骤1中,将数据集中的所有图片缩放成卷积神经网络的输入尺寸。
4.如权利要求1所述的一种基于元学习的细粒度分类方法,其特征在于:所述步骤3中,采用训练集训练细粒度分类网络的具体过程是:对训练集进行样本采集,随机采集N*K个样本作为一个样本集合,接着利用随机梯度下降的方法进行权重更新,再将更新之后的权重输入到一个新的样本集合中,求得误差,利用Adam优化器对所求的误差总和进行反向梯度下降,损失函数随着误差的反向传播不断下降,训练准确率不断上升,当损失函数收敛并不再继续下降时,保存卷积神经网络模型,得到预训练好的卷积神经网络。
5.如权利要求4所述的一种基于元学习的细粒度分类方法,其特征在于:所述步骤4中,对测试集进行样本采集时,在N类不同的样本中分别采集K个样本喂入预训练好的卷积神经网络进行测试。
6.如权利要求1所述的一种基于元学习的细粒度分类方法,其特征在于:所述卷积神经网络采用top-down和bottom-up的模块结构,每个top-down和bottom-up的结构由四个相连的卷积依次实现降采样和上采样的功能,再将所得到的特征和上一个模块的特征图相融合,将最后一个top-down和bottom-up输出的特征图输入进一个全连接层,得到输入至分类层的特征向量。
7.如权利要求6所述的一种基于元学习的细粒度分类方法,其特征在于:所述Top-down,bottom-up模块包含两个卷积和两个反卷积,输入特征图首先依次输入进两个步长为2的卷积层,得到2*2的输出特征图,接着依次输入进两个步长为2的反卷积层,得到6*6的输出特征图。
8.如权利要求1所述的一种基于元学习的细粒度分类方法,其特征在于:需改变待测试的数据类别时,首先将一个与训练集样本类别完全不同的测试集喂入预训练好的卷积神经网络中,接着将元学习者的学习率设置为0,将任务学习者的学习率保持不变,利用随机梯度下降算法对卷积神经网络模型进行微调,最后将测试集数据喂入微调之后的卷积神经网络进行测试。
9.如权利要求1所述的一种基于元学习的细粒度分类方法,其特征在于:所述步骤2中,采用如下至少一种方式进行数据增强:平移,缩放,旋转,翻转。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学;东南大学—无锡集成电路技术研究所;南京三宝科技股份有限公司,未经东南大学;东南大学—无锡集成电路技术研究所;南京三宝科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811451465.3/1.html,转载请声明来源钻瓜专利网。