[发明专利]基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法在审
申请号: | 202211152826.0 | 申请日: | 2022-09-21 |
公开(公告)号: | CN115527064A | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 杜吉祥;黄政;张洪博;翟传敏 | 申请(专利权)人: | 华侨大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764 |
代理公司: | 厦门智慧呈睿知识产权代理事务所(普通合伙) 35222 | 代理人: | 王玮婷 |
地址: | 362000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 阶段 vit 对比 学习 蘑菇 细粒度 图像 分类 方法 | ||
1.一种基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,其特征在于,包含:
获取待识别图像;
根据所述待识别图像,进行图像重叠划分,获取多个部分重叠的图像块;
根据所述多个部分重叠的图像块,获取嵌入序列;
将所述嵌入序列输入预先训练好的基于池化的多阶段ViT编码器中进行编码,获取所述待识别图像的特征编码;
将所述特征编码输入分类器中进行分类,获取所述待识别图像的识别结果;
所述预先训练好的基于池化的多阶段ViT编码器包含间隔设置的子编码器和池化层;所述子编码器包含L层transformer block,用以将所述嵌入序列编码成特征图;所述池化层配置于所述子编码器之间,用以调整所述特征图的空间尺寸。
2.根据权利要求1所述的基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,其特征在于,所述子编码器的数量为3个;所述池化层的数量为2个;3个所述子编码器和2个所述池化层之间间隔设置,以构成三阶段的ViT编码器。
3.根据权利要求2所述的基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,其特征在于,三个子编码器的transformer block层数分别为3、6和4。
4.根据权利要求1所述的基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,其特征在于,所述池化层用于:
将前一个子编码器输出的特征图拆分成分类表示和二维的空间表示;
将所述空间表示变换成3D张量,然后通过depth-wise卷积,获取尺寸减小后的新的3D张量;
将所述新的3D张量变换成新的空间表示;
将所述分类表示调整为与所述新的空间表示维度相同的新的分类表示;
将所述新的空间表示和所述新的分类表示拼接,获取新的特征图;其中,所述新的特征图用以输入后一个子编码器。
5.根据权利要求4所述的基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,其特征在于,将所述空间表示变换成3D张量,然后通过depth-wise卷积,获取尺寸减小后的新的3D张量,具体包括:
将所述空间表示变换成3D张量;其中,所述3D张量的尺寸为(D,NH,NW),式中,D为通道数,NH和NW为分辨率;
根据所述3D张量,通过输入通为D,输出通道2D,卷积核为(3,3),步幅为2的depth-wise卷积运算,获取所述新的3D张量;其中,所述新的3D张量的尺寸为
将所述新的3D张量变换成新的空间表示,具体包括:
将所述新的3D张量和与其尺寸相同的位置嵌入相加,获得带位置信息的新的3D张量;
将所述带位置信息的新的3D张量变换成所述新的空间表示;
将所述分类表示调整为与所述新的空间表示维度相同的新的分类表示,具体包括:
根据所述分类表示,通过全连接层,获取与所述新的空间表示通道数相同的所述新的分类表示。
6.根据权利要求1所述的基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,其特征在于,
根据所述待识别图像,进行图像重叠划分,获取多个部分重叠的图像块,具体包括:
根据所述待识别图像,以卷积核为(P,P)步幅为S进行2D卷积,获取三维块嵌入;其中,0S≤P。
7.根据权利要求6所述的基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,其特征在于,
根据所述多个部分重叠的图像块,获取嵌入序列,具体包括:
将所述三维块嵌入和与其尺寸相同的三维位置嵌入相加,获取新的三维块嵌入;
将所述新的三维块嵌入变换为二维,获取块嵌入序列;
将所述块嵌入序列和与其通道数相同的分类表示向量进行拼接,获取所述嵌入序列。
8.根据权利要求1至7任意一项所述的基于多阶段ViT与对比学习的毒蘑菇细粒度图像分类方法,其特征在于,
分类器以对比损失和交叉熵损失相结合作为损失函数训练得到;损失函数L的表达式为:L=Lcon(Z)+Lcross(y,y′),式中,Lcon(Z)表示对比损失,Lcross(y,y′)表示交叉熵损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211152826.0/1.html,转载请声明来源钻瓜专利网。