[发明专利]一种基于跨层注意力机制特征融合的目标检测方法及系统在审
| 申请号: | 202111671429.X | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114299281A | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 胡建国;张月;卢星宇;杨学彬;吴劲;段志奎 | 申请(专利权)人: | 中山大学;中山大学深圳研究院;广州智慧城市发展研究院 |
| 主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/80;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 广州专理知识产权代理事务所(普通合伙) 44493 | 代理人: | 曲超 |
| 地址: | 510000 *** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 特征 融合 目标 检测 方法 系统 | ||
1.一种基于跨层注意力机制特征融合的目标检测方法,其特征在于,所述方法包括以下步骤:
S100,获取输入的图像;
S200,通过预训练好的基础网络对输入的图像进行特征提取;
S300,在基础网络的各个阶段产生不同空间分辨率和通道数量的特征图;
S400,使用跨层注意力特征金字塔网络来对基础网络各个阶段得到的特征图进行跨层融合;
S500,在输出的多个特征图上分别进行目标的分类和回归,实现目标的检测。
2.根据权利要求1所述的一种基于跨层注意力机制特征融合的目标检测方法,其特征在于,在S400中,跨层注意力特征金字塔网络的构建方法为:使用跨空间和尺度的交互方式,包括自级、自上而下、自下而上三种交互方式,对于三种交互方式输出的特征图,对其进行重排分组,将同一尺度的特征图归为一组,并对每组特征图采用自适应特征融合的方法进行特征融合得到一张特征图,其中自适应特征融合可以学习不同特征图之间的联系,搜索最优融合;最后,多张融合后的特征图构成跨层注意力特征金字塔网络。
3.根据权利要求1所述的一种基于跨层注意力机制特征融合的目标检测方法,其特征在于,在S400中,跨层注意力特征交互主要由三个部分组成:自级注意力模块、自上而下注意力模块、自下而上级注意力模块。
4.根据权利要求1所述的一种基于跨层注意力机制特征融合的目标检测方法,其特征在于,在S400中,自级注意力模块分为两个部分:局部分组自注意力LSA和全局子采样自注意力GSA。
5.根据权利要求4所述的一种基于跨层注意力机制特征融合的目标检测方法,其特征在于,局部分组自注意力LSA包括以下步骤:
对于输入的2维特征图,将特征图划分成m×n个子窗口,接着在每个子窗口内进行以下步骤:对于在每个子窗口,形成三个向量Q、K、V;
通过公式得到特征图Fi。
其中,Q、K、V为分别选取子窗口的图像矩阵中灰度值之和的值最大的一行、灰度值之和的值最小的一行、图像矩阵中间位置的一行形成三个向量Q、K、V。
6.根据权利要求5所述的一种基于跨层注意力机制特征融合的目标检测方法,其特征在于,全局子采样自注意力GSA包括以下步骤:
首先对特征图Fi其进行卷积操作得到特征图F′i;
构建三个向量Q1、K1、V1,其中,Q1是来源于Fi的向量,K1和V1是来源于F′i的向量;最后,将Q1、K1、V1通过公式得到最终的特征图Pi;
其中,Q1、K1、V1为分别选取特征图F′i的图像矩阵中灰度值之和的值最大的一行、灰度值之和的值最小的一行、图像矩阵中间位置的一行形成三个向量Q1、K1、V1。
7.根据权利要求6所述的一种基于跨层注意力机制特征融合的目标检测方法,其特征在于,自上而下注意力模块执行包括以下步骤:
选取2个特征图作为高层粗粒度的特征图Cc和低层细粒度特征图Cf;
在低层细粒度特征图Cf进行局部分组自注意力LSA,即把Cf划分m×n个窗口,并且在每个子窗口内进行局部分组自注意力LSA,得到特征图Ff;
对高层粗粒度特征图Cc进行卷积操作得到特征图Fc,构建三个向量Q、K、V,Q是来源于Ff的向量,K和V是来源于Fc的向量,将Q、K、V通过公式得到最终的特征图Pf。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;中山大学深圳研究院;广州智慧城市发展研究院,未经中山大学;中山大学深圳研究院;广州智慧城市发展研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111671429.X/1.html,转载请声明来源钻瓜专利网。





