[发明专利]基于注意力机制的图像识别方法、系统、设备和存储介质有效
申请号: | 202111158628.0 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113591883B | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 蒋杰;杨君燕;康来;魏迎梅;谢毓湘;孙家豪;刘阳;何亦湘 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N20/00 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 图像 识别 方法 系统 设备 存储 介质 | ||
本申请涉及一种基于注意力机制的图像识别方法、系统、设备和存储介质。该方法包括:获取待识别图像的小样本数据集,将小样本数据集经过多头注意力模型进行图像的特征向量处理;将处理后得到的特征向量矩阵经过高斯混合模型进行预处理,使得特征向量矩阵具备高斯分布;将分布一致的特征向量矩阵经过最优运输原理算法和距离度量算法进行聚类计算,得到聚类特征信息,根据聚类特征信息获取图像识别结果。本发明以层级化的多头注意力特征提取来更全面地提取图像中的关键信息,使得图像识别的广度和范围显著提高,同时对距离算法进行了改进,结合最优运输原理的思想,实现了计算非精确距离重心,避免了过拟合问题,进一步提高了图像识别准确度。
技术领域
本申请涉及机器学习领域,特别是涉及一种基于注意力机制的图像识别方法、系统、设备和存储介质。
背景技术
随着人工智能的发展,在深度学习的实践任务中,计算机往往需要大量的样本来不断地训练算法,最后才可能获得一个较好的识别物体的能力。在训练样本特别少的情况下,传统的深度学习算法无法取得良好的效果,对算法的工业应用范围造成了一定的限制,例如单用户人脸和声纹识别、药物研发、推荐冷启动、欺诈识别等样本规模小或数据收集成本高的场景。考虑到计算机和人脑对于相同任务所需要的资源的显著差异,小样本学习被提出作为一种特别的深度学习手段,以获取人类大脑通过较小的代价来学习物体识别的效果。
现有的深度学习模型的结构还都比较基础,大多是由进行图像的特征提取的主干网络和进行特征相似性度量的度量网络两者简单拼接而成的,其主干网络采用的都是一些适用于大部分任务的普适性经典网络,例如有些深度学习网络所提取的特征虽然很多,但有效性远远没有达到能够满足小样本之间的相似性度量的要求。同时,度量网络仅仅基于距离算法对特征进行聚类,无用特征的干扰过大,在实验过程中会存在过拟合问题,导致特征聚类效果不好。
发明内容
基于此,有必要针对上述技术问题,提供一种基于注意力机制的图像识别方法、系统、计算机设备和存储介质。
第一方面,本发明实施例提供了一种基于注意力机制的图像识别方法,该方法包括:
获取待识别图像的小样本数据集,将所述小样本数据集经过多头注意力模型进行图像的特征向量处理;
将处理后得到的特征向量矩阵经过高斯混合模型进行预处理,使得所述特征向量矩阵具备高斯分布;
将分布一致的所述特征向量矩阵经过最优运输原理算法和距离度量算法进行聚类计算,得到聚类特征信息,根据所述聚类特征信息获取图像识别结果。
进一步的,所述获取待识别图像的小样本数据集,将所述小样本数据集经过多头注意力模型进行图像的特征向量处理,包括:
依次对所述小样本数据集中包括的特征图进行分层化的卷积处理;
对包括粗放信息的所述特征图输入到第一注意力头中,并加以矩阵相乘操作后进行掩膜;
将所述特征图进行卷积操作后,输入到第二注意力头后进行掩膜操作;
再次将所述特征图进行卷积后进行随即池化操作,并输入到第三注意力头后进行掩膜操作;
对三次掩膜操作筛选后得到所述特征向量矩阵。
进一步的,所述将处理后得到的特征向量矩阵经过高斯混合模型进行预处理,使得所述特征向量矩阵具备高斯分布,包括:
将所述特征向量矩阵输入到奇异值分解函数中进行QR分解计算;
将经过分解计算后的所述特征向量通过归一化函数处理,并通过高斯子分布模型使得所述特征向量矩阵符合高斯分布;
通过所述高斯混合模型融合不同的所述子高斯分布模型,对所述高斯混合模型的参数进行迭代,得到分布一致的所述特征向量矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111158628.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序