[发明专利]一种基于特征融合和自注意力机制的多标签图像分类方法在审
申请号: | 202310728668.7 | 申请日: | 2023-06-19 |
公开(公告)号: | CN116935100A | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 高世杰;韩立新 | 申请(专利权)人: | 河海大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/80;G06V10/44;G06V10/42;G06V20/70;G06V10/82;G06N3/0464;G06N3/0499;G06N3/048 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210098 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了一种基于特征融合和自注意力机制的多标签图像分类方法,该方法主要包含以下步骤:图像全局特征提取,使用深度卷积神经网络提取图像全局特征;图像局部特征提取,在上述深度卷积神经网络中间层生成的特征图上实施多个卷积核大小为1*1的卷积运算,提取图像局部特征;特征融合,基于自注意力机制,对提取到的图像的全局特征以及局部特征进行融合,在每一类别上生成该类别下的特征表达;图像多标签分类,基于融合的特征表达,经全连接层和sigmoid激活函数,实现图像标签的生成。本发明的图像多标签分类方法,提供了一种图像局部特征和全局特征融合的方式,可有效地建模图像中小目标的视觉特征,并将标签之间的语义相关性纳入考虑,能够提升图像多标签分类精度。 | ||
搜索关键词: | 一种 基于 特征 融合 注意力 机制 标签 图像 分类 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310728668.7/,转载请声明来源钻瓜专利网。