[发明专利]一种基于全空间编码注意力模块的SAR图像目标检测方法在审

申请号：	202210901110.X	申请日：	2022-07-28
公开（公告）号：	CN115147731A	公开（公告）日：	2022-10-04
发明（设计）人：	张弘;刘源;杨一帆;袁丁;李旭亮;宋剑波	申请（专利权）人：	北京航空航天大学
主分类号：	G06V20/13	分类号：	G06V20/13;G06V10/80;G06V10/82;G06V10/764;G06N3/04;G06N3/08
代理公司：	北京科迪生专利代理有限责任公司 11251	代理人：	安丽;顾炜
地址：	100191***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于空间编码注意力模块 sar 图像目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于全空间编码注意力模块的SAR图像目标检测方法，其特征在于：包括如下步骤：

步骤1：预处理SAR图像的目标检测数据集，得到目标检测数据集的标注信息，并将目标检测数据集划分训练集和测试集；

步骤2，将全空间编码注意力模块作为整体嵌入到深度目标检测神经网络的骨干网络中以进行特征提取，得到加入全空间编码注意力模块的深度目标检测神经网络，在不同的空间方向上对特征通道进行权重编码，增强骨干网络对要检测图片的特征提取能力，并使用金字塔结构对加入全空间编码注意力模块的深度目标检测神经网络提取到的特征图进行多尺度特征融合，得到融合后的多尺度特征图，提高检测网络的检测精度；

步骤3，在训练阶段将融合后的多尺度特征图分别送入两个检测分支进行回归和分类任务的预测，两个不同任务的检测分支，使得分类和回归任务进行直接预测和分别解耦，以能够提高深度目标检测神经网络的检测效果和训练效率；第一个检测分支在多尺度特征图的每个像素位置上进行目标类别的预测，得到该像素位置目标所属类别；第二个检测分支在多尺度特征图的每个像素位置上，进行置信度和候选框位置参数的预测，得到该像素位置目标所属类别的置信度和该像素位置目标的候选框位置参数；最终预测得到输入网络的训练集图片中包含的目标的类别以及所在的位置；

步骤4，将预测得到的训练集中目标的类别与位置与训练集的标注信息一起输入损失函数，计算得到每一个损失项的当前损失值，结合历史的损失值，基于方差和均值进行动态调整该损失项的权重，综合加权得到最终的损失值；

步骤5，将得到的最终损失值进行反向传递，更新加入全空间编码注意力模块的深度目标检测神经网络的网络参数，根据设置的最大迭代次数、学习率和反向传播算法，经过反复训练，直至带有全空间编码注意力模块的深度目标检测神经网络的参数收敛，得到最终训练完成的检测模型；

步骤6，在SAR图像测试数据集上对训练得到的检测模型进行测试，输出保存可视化之后测试结果，以及加入注意力模块前后的平均精度平均值mAP检测指标。

2.根据权利要求1所述的基于全空间编码注意力模块的SAR图像目标检测方法，其特征在于：所述步骤2中，全空间编码注意力模块由一个可变形卷积层、两个卷积层、一个池化层、两个激活层、一个特征拼接层和一个特征分离层堆叠而成；所有可变形卷积层的卷积核大小为3×3，卷积层的卷积核大小为3×3和1×1，池化层分别在特征的高和宽方向上进行平均池化，激活层的激活函数为RELU和Sigmoid，拼接层将池化层得到的特征进行拼接，然后送入卷积层，分离层将卷积层得到的特征进行分离，分离后的特征再送入第二个卷积层，输出特征维度大小与输入特征相等，作为权重与输入特征进行点乘操作，增加有用信息的权重，得到最终的输出特征；所述的全空间编码注意力模块能够在不同的方向上对特征图进行编码，实现通道信息的优选，能够最大程度的利用相关信息。

3.根据权利要求1所述的基于全空间编码注意力模块的SAR图像目标检测方法，其特征在于：所述骨干网由多个卷积层、多个归一化层和多个激活层堆叠而成；所述卷积层的卷积核大小为3×3、5×5、7×7，批归一化层为BN或GN，激活层的激活函数为RELU或SiLU；使用全空间编码注意力模块替换部分卷积层，该深度卷积网络应包含N个阶段，且N不小于4，其输入为一张图片，输出为该图片对应的特征图。

4.根据权利要求1所述的基于全空间编码注意力模块的SAR图像目标检测方法，其特征在于：所述步骤3中，第一分支为分类分支，包含三个卷积层，用于预测检测框的置信度，其输出的张量维度为检测目标的类别数；第二分支为回归分支，包含三个卷积层，用于预测检测框的相关参数。

5.根据权利要求1所述的基于全空间编码注意力模块的SAR图像目标检测方法，其特征在于：所述步骤4中，总的损失函数loss_total为：

loss_total＝α₁·loss_cls+α₂·loss_obj+α₃·loss_IoU

其中loss_cls表示分类损失，loss_obj表示置信度损失，loss_IoU表示预测框位置损失，

α₁、α₂、α₃为权重因子，并且满足α₁+α₂+α₃＝1，i＝1，2，3；标准偏差其中c_i为loss_total中每一项损失的大小，为loss_total中每一项损失值的方差，为loss_total中每一项损失值的均值。