[发明专利]基于视觉基元挖掘的小样本图像分类方法在审
| 申请号: | 202310265072.8 | 申请日: | 2023-03-17 |
| 公开(公告)号: | CN116168254A | 公开(公告)日: | 2023-05-26 |
| 发明(设计)人: | 石光明;杨建朋;牛宇航;谢雪梅 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/088;G06N5/04;G06N3/0464 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
| 地址: | 710071 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 视觉 挖掘 样本 图像 分类 方法 | ||
1.一种基于视觉基元挖掘的小样本图像分类方法,其特征在于,包括如下步骤:
(1)利用自监督拼图任务的损失作为特征提取器的正则项,对基元挖掘网络进行约束:
(1a)对图像分类任务中的支持集BS和查询集BQ所包含的所有图片使用卷积神经网络提取图像特征f;
(1b)将任务中支持集BS的图像分割成大小相等的9个图像块,提取每个图像块的特征,使用该特征训练基元挖掘网络执行图像块相对位置分类任务,将全连接层的交叉熵分类损失Lssl作为基元挖掘网络的损失函数,对基元挖掘网络进行约束;
(2)在图像特征f基础上合成视觉基元:
(2a)用(1a)操作得到的所有图像特征f构成集合Ω;
(2b)对集合Ω中的每个图像特征采用k组并行的自适应通道分组操作得到k组特定权重;
(2c)使用k组权重分别对每个图像特征的所有通道进行加权聚类,得到k组空间相关和语义相关的通道,并分别对k组通道进行加权生成k个基元级掩码mi,再使用k个基元级掩码mi对图像特征进行过滤获得k个初始基元pi;
(3)获取视觉基元之间的内部相关性:
(3a)使用初始视觉基元构建一个基元关系图,并对k个视觉基元特征采用全局平均池化操作后嵌入到基元关系图中,作为基元关系图的k个节点;
(3b)计算基元关系图中k个节点之间的相关性矩阵,以表示视觉基元之间的内部相关性;
(3c)使用基元关系图的节点,根据基元关系图的相关性矩阵,使用图卷积操作进行图卷积推理更新基元关系图中的节点特征,使得各个节点的视觉基元可编码自身节点的视觉基元与其他节点的视觉基元之间的相关性信息,以得到带有相关性信息的视觉基元;
(4)使用视觉基元合成特定任务的注意力特征,为每个视觉基元生成特定任务的权重:
(4a)通过步骤(2)和步骤(3)为每个来自于支持集的图像样本xs∈BS,提取一组视觉基元Ps,对每个来自查询集的图像样本xq∈BQ,提取一组查询图像的视觉基元Pq;
(4b)将两个视觉基元Ps和Pq分别压缩为两个基元映射和并将这两个基元映射拼接成映射对
(4c)连接k个基元映射建立特定任务的注意力特征Fa∈RA·H·W,使用注意力特征Fa训练跨任务的权重生成器G(·),自适应地将更高的权重分配给重要的视觉基元;
(5)计算基元相似度实现图像分类:
(5a)根据(4c)中生成的权重,对视觉基元进行加权,计算支持集中图像基元与查询集中图像基元之间相似度,并用其作为不同图像间的相似度;
(5b)使用交叉熵分类损失函数对不同图像间的相似度进行优化,得到图像的分类结果。
2.根据权利要求1所述的方法,其特征在于:步骤(1b)中使用图像块特征训练基元挖掘网络执行图像块相对位置分类任务,其实现如下:
将图片按行和列划分为大小相等的h.w个图像块,对这些图像块随机排列得到图像块序列xp,并将xp中图像块的位置索引作为图像块标签yp,其中,h是图片分割的行数,w是图片分割的列数;
将图像块序列xp输入到特征提取器f(·)中,得到h·w个图像块特征并对其进行连接,得到串联图像块特征fp;
将串联图像块特征fp中的所有图像块输入到卷积神经网络的全连接层中得到每个图像块的分类结果。
3.根据权利要求1所述的方法,其特征在于:步骤(1b)中将全连接层的交叉熵分类损失Lssl作为基元挖掘网络的损失函数,表述如下:
其中,fp∈Rh·w·d,h·w是分割后的图片块数量,d是特征图的维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310265072.8/1.html,转载请声明来源钻瓜专利网。





