[发明专利]一种基于元学习的对抗网络的零样本图像分类方法有效

专利信息
申请号: 202011147848.9 申请日: 2020-10-23
公开(公告)号: CN112364894B 公开(公告)日: 2022-07-08
发明(设计)人: 冀中;崔碧莹 申请(专利权)人: 天津大学
主分类号: G06V10/764 分类号: G06V10/764;G06K9/62;G06N3/04;G06N3/08;G06V10/774
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 潘俊达
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 学习 对抗 网络 样本 图像 分类 方法
【权利要求书】:

1.一种基于元学习的对抗网络的零样本图像分类方法,其特征在于,包括如下步骤:

1)从可见类中随机选择M个类别作为一个episode的训练集,可见类中剩余类别作为这个episode的测试类,从而训练集可知其中ntr为每个episode中训练集样本的数目,xi为第i个训练样本的视觉特征,yi为第i个训练样本的相应类别标签,ai∈Atr为第i个训练样本的类别语义原型,同时ate∈Ate为一个episode中测试类的语义原型,定义两个记忆模块m1、m2

2)将训练样本的视觉特征xi随机选取设定批量的数据x,输入到一个由编码器E1和解码器D1组成的变分自编码器中,使生成和真实视觉样本相似的伪视觉特征重构约束如下:

其中,为2范数表示;

3)经过变分自编码器后,计算变分自编码器损失函数LVAE

4)将生成的伪视觉特征经过一个降维矩阵W后输入到softmax分类器中,获得一个one-hot分类结果表示每个类别的概率,根据其真实的标签计算分类损失如下:

其中f表示softmax分类器,W为分类器参数,作用是将生成特征的维度降到M维再和真实标签y做对比,把W定义为视觉模态的分类器;

5)将训练样本的视觉特征x、生成的伪视觉特征输入到判别器D中,对抗损失为LD

6)计算这个episode视觉模态训练过程的蒸馏损失Lkd-w和Lkd-v

7)设定目标函数为上述损失函数相加,多次迭代训练视觉模态的变分自编码器:

其中,λ1、λ2为特征重构损失和变分自编码器损失的权重系数,将训练好的变分自编码器的编码器E1和解码器D1的参数分别存储到两个记忆模块中;

8)将训练类中的类别语义原型atr作为一个自编码器的输入,生成相应的视觉原型同时把定义为语义模态的分类器,利用对重构特征进行分类,计算分类损失Lcls2

9)用视觉模态的分类器W约束语义模态的分类器从而得到视觉对语义的蒸馏约束,计算蒸馏损失Lkd2

10)训练语义模态的自编码器的目标函数如下:

La=Lcls23Lsup4Lkd2

其中,Lsup为视觉模态的解码器对语义模态的解码器的监督,λ3和λ4分别为监督损失和蒸馏损失的权重系数;

11)该episode的测试过程:将测试集的语义原型ate输入到训练好的编码器E2和解码器D2中,获得相应的视觉原型

12)将和拼接在一起,得到所有可见类的分类器此时再用分类器CS对所有可见类样本进行分类,计算分类损失,对之前学习到的参数进行微调:

13)将可见类和未见类的测试样本的语义特征at输入到语义编码器和解码器中,将生成的视觉特征原型和xt做对比,其中,xt为测试样本的视觉特征,利用最近邻的方法得到分类结果;

14)重复步骤1)~步骤13),完成多个episode的元训练过程,直到得到最优的分类性能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011147848.9/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top