[发明专利]一种基于元学习的对抗网络的零样本图像分类方法有效
| 申请号: | 202011147848.9 | 申请日: | 2020-10-23 |
| 公开(公告)号: | CN112364894B | 公开(公告)日: | 2022-07-08 |
| 发明(设计)人: | 冀中;崔碧莹 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06N3/04;G06N3/08;G06V10/774 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 潘俊达 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 学习 对抗 网络 样本 图像 分类 方法 | ||
1.一种基于元学习的对抗网络的零样本图像分类方法,其特征在于,包括如下步骤:
1)从可见类中随机选择M个类别作为一个episode的训练集,可见类中剩余类别作为这个episode的测试类,从而训练集可知其中ntr为每个episode中训练集样本的数目,xi为第i个训练样本的视觉特征,yi为第i个训练样本的相应类别标签,ai∈Atr为第i个训练样本的类别语义原型,同时ate∈Ate为一个episode中测试类的语义原型,定义两个记忆模块m1、m2;
2)将训练样本的视觉特征xi随机选取设定批量的数据x,输入到一个由编码器E1和解码器D1组成的变分自编码器中,使生成和真实视觉样本相似的伪视觉特征重构约束如下:
其中,为2范数表示;
3)经过变分自编码器后,计算变分自编码器损失函数LVAE;
4)将生成的伪视觉特征经过一个降维矩阵W后输入到softmax分类器中,获得一个one-hot分类结果表示每个类别的概率,根据其真实的标签计算分类损失如下:
其中f表示softmax分类器,W为分类器参数,作用是将生成特征的维度降到M维再和真实标签y做对比,把W定义为视觉模态的分类器;
5)将训练样本的视觉特征x、生成的伪视觉特征输入到判别器D中,对抗损失为LD:
6)计算这个episode视觉模态训练过程的蒸馏损失Lkd-w和Lkd-v;
7)设定目标函数为上述损失函数相加,多次迭代训练视觉模态的变分自编码器:
其中,λ1、λ2为特征重构损失和变分自编码器损失的权重系数,将训练好的变分自编码器的编码器E1和解码器D1的参数分别存储到两个记忆模块中;
8)将训练类中的类别语义原型atr作为一个自编码器的输入,生成相应的视觉原型同时把定义为语义模态的分类器,利用对重构特征进行分类,计算分类损失Lcls2:
;
9)用视觉模态的分类器W约束语义模态的分类器从而得到视觉对语义的蒸馏约束,计算蒸馏损失Lkd2
;
10)训练语义模态的自编码器的目标函数如下:
La=Lcls2+λ3Lsup+λ4Lkd2
其中,Lsup为视觉模态的解码器对语义模态的解码器的监督,λ3和λ4分别为监督损失和蒸馏损失的权重系数;
11)该episode的测试过程:将测试集的语义原型ate输入到训练好的编码器E2和解码器D2中,获得相应的视觉原型
12)将和拼接在一起,得到所有可见类的分类器此时再用分类器CS对所有可见类样本进行分类,计算分类损失,对之前学习到的参数进行微调:
;
13)将可见类和未见类的测试样本的语义特征at输入到语义编码器和解码器中,将生成的视觉特征原型和xt做对比,其中,xt为测试样本的视觉特征,利用最近邻的方法得到分类结果;
14)重复步骤1)~步骤13),完成多个episode的元训练过程,直到得到最优的分类性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011147848.9/1.html,转载请声明来源钻瓜专利网。





