[发明专利]一种基于数据增强的半监督零样本图像分类方法有效

专利信息
申请号: 202011147838.5 申请日: 2020-10-23
公开(公告)号: CN112364893B 公开(公告)日: 2022-07-05
发明(设计)人: 冀中;崔碧莹 申请(专利权)人: 天津大学
主分类号: G06V10/764 分类号: G06V10/764;G06K9/62;G06V10/774
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 潘俊达
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 增强 监督 样本 图像 分类 方法
【权利要求书】:

1.一种基于数据增强的半监督零样本图像分类方法,其特征在于,包括如下步骤:

1)分别初始化回归器R和生成器G的参数为r和e;

2)将可见类的视觉特征和类别语义特征随机选取设定批量的数据分别记作xs和as,从附加类样本中也提取相同批量的数据记作xa,所述附加类包括来自K个类别的k个样本,表示为其中xa和ya分别表示样本的视觉特征和类别标签;

3)将xs输入到回归器R中,输出语义特征并且使用真实的类别语义特征as作为回归器的约束,计算回归损失函数Lreg

其中,为2范数表示;

4)将附加类的样本xa输入回归器R,输出相应语义特征

5)将真实的可见类语义特征as和生成的附加类语义特征级联,输入到生成器G中,获得合成的可见类和附加类的伪视觉特征:

其中,[;]表示两个向量的级联;

6)计算生成样本与真实样本的重构损失函数:

7)将回归损失函数与重构损失函数相加,训练回归器和生成器,更新它们的参数:

Ltotal=Lreg+λLrec

其中,Ltotal表示模型的总损失函数;

8)重复步骤2)~步骤7),达到设定的迭代次数,得到最终的回归器R和生成器G的参数r和e;

9)将测试样本的视觉特征xt输入到训练好的生成器G中,获得对应的语义特征,利用最近邻的方法对生成语义特征进行分类,即:

2.如权利要求1所述的一种基于数据增强的半监督零样本图像分类方法,其特征在于,所述步骤2)的附加类ya的样本视觉特征xa的获取过程包括:

利用搜索引擎,搜索和未见类相关的类别作为附加类别ya,下载若干附加类的清晰图像,且保证附加类别的数目与未见类数目相同,且附加类与可见类和未见类都不相交;

将获得的图像输入resnet101网络,获得相应的视觉特征xa

3.如权利要求1所述的一种基于数据增强的半监督零样本图像分类方法,其特征在于,所述步骤3)的利用回归器R生成语义特征的工作过程包括:

回归器R的网络结构由3层全连接层表示,其中前两层利用relu函数作为激活层,工作过程为:

其中,fc1、fc2和fc3分别表示3个全连接层,relu()表示激活函数。

4.如权利要求1所述的一种基于数据增强的半监督零样本图像分类方法,其特征在于,所述步骤5)的生成器G的结构使用与回归器对称的结构,其工作过程为:

5.如权利要求1所述的一种基于数据增强的半监督零样本图像分类方法,其特征在于,还包括:

将图像数据集分为可见类和未见类,可见类包括来自N个类别的n个样本,表示为其中为第i个训练样本的视觉特征,和分别表示第i个训练样本相应的类别标签和类别语义原型。

6.如权利要求1所述的一种基于数据增强的半监督零样本图像分类方法,其特征在于,还包括:

给定xt为测试样本的视觉特征,at为测试样本的类别语义特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011147838.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top