[发明专利]基于空间关联的多标签图像识别方法有效
申请号: | 202111171161.3 | 申请日: | 2021-10-08 |
公开(公告)号: | CN113688946B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 李甲;赵佳伟;赵一凡;郭鑫;赵沁平 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/77;G06V10/74;G06V10/52;G06V10/80;G06V10/82;G06N3/042;G06N3/0464;G06N3/0455;G06N3/048;G06N3/09 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 孙姣 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 空间 关联 标签 图像 识别 方法 | ||
1.一种基于空间关联的多标签图像识别方法,包括:
步骤S100,给定自然图像,输入到卷积神经网络编码器,得到图像包含不同尺度信息的第一特征图;
步骤S200,将第一特征图经过跨尺度特征增强模块进一步增强空间信息,再输入空间关联模块,生成表示空间关联的第二特征图;
步骤S300,将第一特征图经过降维得到维度为类别数量的热度图,对热度图通过全局池化与损失函数进行约束以保证热度图与每个类别的响应;将热度图转置后与第一特征图点乘后得到图神经网络的节点,再通过邻接矩阵构造模块得到邻接矩阵;
步骤S400,将节点与邻接矩阵输入标签关联模块,生成表示标签关联的第三特征图;
步骤S500,将第二特征图与第三特征图的分类结果通过置信度加权模块得到最终的图像表征和分类结果。
2.根据权利要求1所述的空间关联的多标签图像识别方法,其特征在于:在步骤S200中,跨尺度特征增强模块具有以下特征:
输入第一特征图中的三十二倍下采样特征F32(C×H32×W32),通过1×1卷积进行维度压缩,得到FT32(CT×H32×W32);输入第一特征图中的三十二倍下采样特征F32(C×H32×W32),通过3×3卷积同时进行维度压缩与分辨率压缩,得到六十四倍下采样特征FT64(CT×H64×W64);输入第一特征图中的十六倍下采样特征F16(C×H16×W16),通过1×1卷积进行维度压缩,得到FT16(CT×H16×W16);
将这三种不同尺度的特征输入到跨尺度特征增强模块中,通过上采样将不同尺度的特征尺度采样到相同尺度,再对不同特征进行相乘,抽取出不同特征之间相似的空间信息,再分别下采样到不同尺度与原来的特征通过相加进行增强,最后输出增强空间信息后的不同尺度特征;跨尺度特征增强模块可以用以下公式来表示:
Fcom=FT16×U(FT32)×U(FT64)
FT16=Fcom+FT16
FT32=D(Fcom)+FT32
FT64=D(Fcom)+FT64,
其中,Fcom是跨尺度特征中提取的相似特征,FT16是十六倍下采样的特征图,FT32是三十二倍下采样的特征图,FT64是六十四倍下采样的特征图是对卷积神经网络编码器ResNet的默认输出特征图进行3×3卷积得到的,U是上采样函数,将所有特征上采样到相同尺度,D是下采样函数,将所有特征下采样到各自尺度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111171161.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种农药微胶囊缓释剂
- 下一篇:机车司机室后墙与机车