[发明专利]一种基于双边注意力机制的复杂背景下目标检测方法在审
申请号: | 202210317817.6 | 申请日: | 2022-03-29 |
公开(公告)号: | CN114677571A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 李春国;罗顺;刘周勇;杨绿溪 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V10/774;G06V10/776;G06V10/26;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 秦秋星 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双边 注意力 机制 复杂 背景 目标 检测 方法 | ||
1.一种基于双边注意力机制的复杂背景下的目标检测方法,其特征在于,该方法包括如下步骤:
步骤S1:根据公开的复杂背景下的目标检测数据集,构建训练集、验证集和测试集;
步骤S2:构建基于双边注意力机制的Bi-SINet网络模型,利用所构建的训练集对Bi-SINet网络模型进行监督训练,直到模型收敛到最优性能;
步骤S3:将收敛的Bi-SINet网络模型在所构建的测试集上进行测试,根据检测结果评估模型性能。
2.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法,其特征在于,所述步骤S1中目标检测数据集包含数据集COD10K、数据集CAMO和数据集CHAMELEON。
3.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法,其特征在于,所述步骤S2具体包括:
步骤S201:对训练数据进行预处理,首先利用双线性插值法将原始图像大小调整为384×384,并调整对应的真实标签,随后进行图像数据增强处理,最后将图像进行归一化处理后输入Bi-SINet网络模型进行训练;
步骤S202:Bi-SINet网络模型对输入图像进行特征提取,随后将提取到的多层特征输入渐进式的检测框架中进行检测;渐进式的检测框架会基于每层特征进行前景目标分割,共输出N个不同尺度的检测结果,用来表示,k=0,1,...,N-1;
步骤S203:在训练阶段,采用交叉熵损失函数和交并比损失函数对模型输出的N个检测结果进行监督训练,总体损失函数可以用Loverall来表示,其计算公式为:
其中,表示第k层检测结果与真实标签之间的结构加权后的交叉熵损失,则表示第k层检测结果与真实标签之间的结构加权后的交并比损失,它们的计算表达式分别为:
其中,H表示图像高度,W表示图像宽度,和maskGT(x,y)分别表示第k层预测结果和真实标签中位置坐标为(x,y)的值,γ是和结构权重相关的参数,w(x,y)表示坐标为(x,y)的位置对应的结构权重,其表达式如下:
其中,Axy表示坐标为(x,y)的像素周围像素的集合;
步骤S204:在训练过程中,采用随机梯度下降优化算法对网络参数进行迭代更新,同时以多项式法对学习率进行衰减;训练过程中,间隔若干次迭代使用所构建的验证集对模型性能进行验证,确保模型收敛到最优性能;
步骤S205:利用优化收敛后固定参数的Bi-SINet网络模型对输入的待检测图像进行前向计算,即可获得前景目标分割图作为检测结果。
4.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法,其特征在于,所述步骤S3具体包括:
步骤S301:将待检测图片归一化后,输入收敛的Bi-SINet网络模型进行检测,在输出的N个不同尺度的检测结果中,选择尺度最大的作为模型的最终检测结果maskpred;
步骤S302:根据模型的检测结果maskpred和对应的真实标签maskGT,计算平均绝对误差MAE,计算公式如下:
其中,H表示图像高度,W表示图像宽度,maskpred(x,y)和maskGT(x,y)分别表示预测结果和真实标签中位置坐标为(x,y)的值;
步骤S303:根据模型的检测结果maskpred和对应的真实标签maskGT,计算客观评价指标EM,计算公式如下:
其中,H代表图像高度,W表示图像宽度,φFM表示增强的对齐矩阵;
步骤S304:根据模型的检测结果maskpred和对应的真实标签maskGT,计算客观评价指标SM,计算公式如下:
SM=αS0+(1-α)Sr (7)
其中S0表示针对目标的结构相似度,Sr表示针对区域的结构相似度,平衡两者的权重a通常取值0.5;
步骤S305:根据模型的检测结果maskpred和对应的真实标签maskGT,计算客观评价指标WFM,计算公式如下:
其中Pw表示加权修正后的准确率,Rw表示加权修正后的召回率,β是平衡准确率和召回率的因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210317817.6/1.html,转载请声明来源钻瓜专利网。