[发明专利]基于空间关联的多标签图像识别方法有效

专利信息
申请号: 202111171161.3 申请日: 2021-10-08
公开(公告)号: CN113688946B 公开(公告)日: 2023-10-24
发明(设计)人: 李甲;赵佳伟;赵一凡;郭鑫;赵沁平 申请(专利权)人: 北京航空航天大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/77;G06V10/74;G06V10/52;G06V10/80;G06V10/82;G06N3/042;G06N3/0464;G06N3/0455;G06N3/048;G06N3/09
代理公司: 北京唯智勤实知识产权代理事务所(普通合伙) 11557 代理人: 孙姣
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 空间 关联 标签 图像 识别 方法
【权利要求书】:

1.一种基于空间关联的多标签图像识别方法,包括:

步骤S100,给定自然图像,输入到卷积神经网络编码器,得到图像包含不同尺度信息的第一特征图;

步骤S200,将第一特征图经过跨尺度特征增强模块进一步增强空间信息,再输入空间关联模块,生成表示空间关联的第二特征图;

步骤S300,将第一特征图经过降维得到维度为类别数量的热度图,对热度图通过全局池化与损失函数进行约束以保证热度图与每个类别的响应;将热度图转置后与第一特征图点乘后得到图神经网络的节点,再通过邻接矩阵构造模块得到邻接矩阵;

步骤S400,将节点与邻接矩阵输入标签关联模块,生成表示标签关联的第三特征图;

步骤S500,将第二特征图与第三特征图的分类结果通过置信度加权模块得到最终的图像表征和分类结果。

2.根据权利要求1所述的空间关联的多标签图像识别方法,其特征在于:在步骤S200中,跨尺度特征增强模块具有以下特征:

输入第一特征图中的三十二倍下采样特征F32(C×H32×W32),通过1×1卷积进行维度压缩,得到FT32(CT×H32×W32);输入第一特征图中的三十二倍下采样特征F32(C×H32×W32),通过3×3卷积同时进行维度压缩与分辨率压缩,得到六十四倍下采样特征FT64(CT×H64×W64);输入第一特征图中的十六倍下采样特征F16(C×H16×W16),通过1×1卷积进行维度压缩,得到FT16(CT×H16×W16);

将这三种不同尺度的特征输入到跨尺度特征增强模块中,通过上采样将不同尺度的特征尺度采样到相同尺度,再对不同特征进行相乘,抽取出不同特征之间相似的空间信息,再分别下采样到不同尺度与原来的特征通过相加进行增强,最后输出增强空间信息后的不同尺度特征;跨尺度特征增强模块可以用以下公式来表示:

Fcom=FT16×U(FT32)×U(FT64)

FT16=Fcom+FT16

FT32=D(Fcom)+FT32

FT64=D(Fcom)+FT64

其中,Fcom是跨尺度特征中提取的相似特征,FT16是十六倍下采样的特征图,FT32是三十二倍下采样的特征图,FT64是六十四倍下采样的特征图是对卷积神经网络编码器ResNet的默认输出特征图进行3×3卷积得到的,U是上采样函数,将所有特征上采样到相同尺度,D是下采样函数,将所有特征下采样到各自尺度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111171161.3/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top