[发明专利]零样本图像识别方法及其识别装置、介质与计算机终端在审
| 申请号: | 202210638733.2 | 申请日: | 2022-06-08 |
| 公开(公告)号: | CN114821196A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 赵鹏;刘金辉;韩莉 | 申请(专利权)人: | 安徽大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06N3/04 |
| 代理公司: | 合肥市泽信专利代理事务所(普通合伙) 34144 | 代理人: | 方荣肖 |
| 地址: | 230022 *** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 样本 图像 识别 方法 及其 装置 介质 计算机 终端 | ||
1.一种基于原型域对齐与跨模态重建的零样本图像识别方法,其特征在于,具有模型训练阶段和零样本图像识别阶段,所述零样本图像识别方法包括以下步骤:
一、模型训练阶段
(1)所述模型训练阶段采用的训练集中包含图像的类别称为可见类,具有可见类的图像和类别语义属性,所述训练集中没有包含图像的类别称为未见类,具有未见类的类别语义属性;
(2)利用视觉提取器对所述可见类的图像获得视觉特征
(3)将所述视觉特征
(4)计算潜在空间中的低维向量
其中,
所述特征分布编码器是通过最小化分布正则化损失完成的,所述特征分布编码器的分布正则化损失
其中,KL(·)表示散度函数,用于度量特征分布编码器获取的分布参数进行重参数化后的低维向量
(5)将所述低维向量
所述域一致性损失
其中,表示该类别的视觉原型,
(6)设计视觉重建损失,最小化所述生成的视觉特征
所述视觉重建损失的函数
其中,M表示数据集中图像的数目,表示第i个图像的视觉特征,表示与该图像的视觉特征对应的生成的视觉特征;
(7)将所述生成的视觉特征
所述特征生成器和所述真假判别器通过对抗的方式进行训练,用于提高视觉特征生成的质量,对抗损失函数
其中,
(8)将所述生成的视觉特征
通过语义解码器,获得视觉特征重构的语义特征
其中,
(9)将所述分布正则化损失、所述域一致性损失、所述视觉重建损失、所述对抗损失和所述语义重建损失相加,获得所述视觉特征生成器的模型整体的损失函数,通过梯度反向传播,优化所述特征生成器的模型的参数,获得训练好的特征生成器;
(10)将未见类的语义特征和从高斯分布中采样的随机向量拼接,输入到所述训练好的特征生成器,生成未见类的视觉特征;
(11)将生成的未见类视觉特征输入到分类器,输出预测的类别标签,通过交叉熵损失,使所述分类器输出的类别标签与生成的未见类视觉特征对应的类别标签尽可能一致,训练获得一个未见类的分类器;
通过所述分类器预测所述生成的未见类视觉特征对应的类别标签,所述分类器的分类函数定义如下:
其中,
所述分类器通过交叉熵损失进行训练,交叉熵损失
其中,
二、零样本图像识别阶段
(12)通过所述视觉提取器和训练好的所述未见类的分类器,获得待预测的未见类图像的类别标签;
其中,通过所述视觉提取器,获得未见类图像对应的视觉特征,再输入到训练好的所述未见类的分类器中,获得识别出的类别标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210638733.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电弧增材用辅助焊丝振动装置
- 下一篇:一种塔式大气污染净化装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





