[发明专利]基于目标检测的多尺度特征融合方法在审
申请号: | 202210303602.9 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114694003A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 王改华;甘鑫;曹清程;翟乾宇;刘洪 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V10/44;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉宇晨专利事务所(普通合伙) 42001 | 代理人: | 余晓雪 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 目标 检测 尺度 特征 融合 方法 | ||
1.一种基于目标检测多尺度特征融合方法,其特征在于:所述基于目标检测多尺度特征融合方法包括以下步骤:
1)将不同尺寸的特征图进行卷积处理后得到通道数相同的特征图;
2)将步骤1)获取得到的特征图分别进行通道维度融合处理以及空间维度融合处理,分别得到通道维度融合处理特征图以及空间维度融合处理特征图;
3)将步骤2)所获取得到的通道维度融合处理特征图以及空间维度融合处理特征图进行融合处理,实现对不同尺寸的特征图在空间和通道两个维度的特征融合。
2.根据权利要求1所述的基于目标检测多尺度特征融合方法,其特征在于:所述步骤1)的具体实现方式是:
1.1)获取不同尺寸的特征图,所述不同尺寸的特征图最少包括特征图C3、特征图C4以及特征图C5;其中特征图C3的尺寸是特征图C4的2倍;特征图C4的尺寸是特征图C5的2倍;
1.2)对不同尺寸的特征图进行经过卷积处理,使得卷积处理后的通道数相同。
3.根据权利要求2所述的基于目标检测多尺度特征融合方法,其特征在于:所述步骤2)中通道维度融合处理的具体实现方式是:将特征图在通带维度上压缩为三维向量,再将不同尺度的特征图在通道维度融合。
4.根据权利要求3所述的基于目标检测多尺度特征融合方法,其特征在于:所述将特征图在通带维度上压缩为三维向量的具体实现方式是:
将特征图经过unfold操作,促使特征图由四维tensor转换成三维tensor;所述四维tensor的维度是【B,C,H,W】,所述三维tensor的维度为【B,C’,L】;
其中:
C’满足以下关系:
C′=C*K*K
其中:
C是原特征图的通道大小;
K是卷积核的大小;
C’是滑动窗口大小;
L满足以下关系:
L=H'*W'
其中:
H是原特征图的长度;
W是原特征图的宽度;
pading是填充大小;
K是卷积核大小;
stride是步距大小;
L是滑动窗口的数量。
5.根据权利要求4所述的基于目标检测多尺度特征融合方法,其特征在于:所述将不同尺度的特征图在通道维度融合的具体实现方式是:
a)特征图C3经过1次unfold操作得到C’3;特征图C4经过2次unfold操作后得到C’4_1以及C’4_2;特征图C5经过1次unfold操作得到C’5;其中:C’3和C’4_1大小相等,C’4_2和C’5大小相等;
b)将C’3和C’4_1融合得到三维tensor、将C’4_2和C’5进行融合得到三维tensor;
c)再将步骤b)的结果通过reshape恢复到4个四维tensor,其中,第一个四维tensor的尺寸和特征图C3的尺寸相同,第2个四维tensor的尺寸以及第3个四维tensor的尺寸分别与特征图C4的尺寸相同,第4个四维tensor的尺寸和特征图C5的尺寸相同;
d)第一个四维tensor得到经过通道维度上融合的特征图P3_1;第4个四维tensor得到经过通道维度上融合的特征图P5_1;将第2个四维tensor和第3个四维tensor相加得到经过通道维度上融合的特征图P4_1;所述特征图P3_1的尺寸、特征图P4_1的尺寸以及特征图P5_1的尺寸均是非等同的。
6.根据权利要求1所述的基于目标检测多尺度特征融合方法,其特征在于:所述步骤2)中空间维度融合处理是对特征图进行上采样,再将不同不同尺度的特征图在空间维度融合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210303602.9/1.html,转载请声明来源钻瓜专利网。