[发明专利]基于轻量化网络的遥感影像多尺度目标检测识别方法在审
| 申请号: | 202111388223.6 | 申请日: | 2021-11-22 |
| 公开(公告)号: | CN114170526A | 公开(公告)日: | 2022-03-11 |
| 发明(设计)人: | 蒋丽婷;张志超;喻金桃 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所 |
| 主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V10/80;G06V10/52;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
| 地址: | 100083 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 量化 网络 遥感 影像 尺度 目标 检测 识别 方法 | ||
1.一种基于轻量化网络的遥感影像多尺度目标检测识别方法,其特征在于,包括以下步骤:
S1、对获取的遥感图像进行预处理;
S2、基于深度可分离卷积替换特征提取主干和检测分枝中的标准卷积过程,并将处理后的图像输入卷积神经网络进行特征提取;
S3、采用特征金字塔,从卷积神经网络不同层抽取不同尺度特征图像进行预测,融合不同层检测结果,得到多尺度融合特征图;
S4、在特征图上设置候选框,生成预测张量,基于此预测目标所属类别的置信度及位置信息。
2.根据权利要求1所述的一种基于轻量化网络的遥感影像多尺度目标检测识别方法,其特征在于,所述步骤S2具体包括:
S21、通过32个3x3的卷积核卷积,在初始层的基础上增加网络层数,提高特征表达能力;
S22、然后由block1和block2交替堆积,每个block由深度卷积和点卷积组成,每个卷积后都进行了批归一化,接着输出到relu层,其中block1的深度卷积卷积步长为1,block2的深度卷积卷积步长为2;
S23、经过13个卷积块实现特征提取后,将conv13特征图反卷积后与conv5融合,将融合后的特征图与conv11、conv13特征图同时送入目标检测模块,进行坐标回归和分类,并对多个尺度特征图上的检测结果进行非极大值抑制,筛选出最终结果,完成特征提取。
3.根据权利要求1所述的一种基于轻量化网络的遥感影像多尺度目标检测识别方法,其特征在于,所述步骤S3具体包括:
S31、计算特征图感受野:
选取合适的特征图
f(x)=k,其中Rk-1<x≤Rk
其中Rk表示第k层感受野大小,初始感受野R0=1,Kk表示第k层卷积核大小,sk表示第k层卷积步长,m为特征图总层数,x为样本长度,f(x)表示该样本长度对应的特征图;
S32、将样本划分为大、中、小3个阶段,分别选取最后3种不同大小的特征图;
S33、采用步长为2的2×2卷积核,通过对38×38的高语义信息特征图进行上采样,将反卷积输出经过批归一化处理和ReLU层后,与10×10的低语义信息特征图分辨率相同,将两种特征图拼接成多通道特征图,利用多通道卷积对经拼接而成的多通道特征图提取特征,使用3×3×256的卷积核实现特征融合。
4.据权利要求1所述的一种基于轻量化网络的遥感影像多尺度目标检测识别方法,其特征在于,所述步骤S4具体包括:
S41、选取有效感受野与理论感受野比例为1/3,并计算候选框大小
其中,Rk表示第k层感受野大小,m为特征图总层数;
确定候选框长宽比,计算出每张特征图候选框对应原图的长宽占比,当长宽比为1时,增加2个长度分别为Sk和的候选框,因此每张特征图有6个候选框,
其中r为长宽比系数,wk,hk分别为第k层特征图候选框长宽;
S42、建立真实标签和候选框的对应关系,真实标签从候选框中选择,匹配原则为:图中真实目标与候选框交并比IoU最大的候选框进行匹配,确保候选框覆盖每一个真实目标,与真实目标覆盖的候选框为正样本,没有匹配目标的候选框为负样本;当候选框匹配多个真实目标,取IoU最大的目标;
S43、采用SSD的损失函数训练模型,损失函数由置信度误差与位置误差的加权构成
其中x表示候选框与这是目标是否匹配,匹配为1,不匹配为0;c为多类目标置信度预测值;为对应于候选框的边界框位置预测值;g是真实目标的位置参数;N是与真实目标匹配的候选框数量;是对位置误差与置信度误差之间的比例进行调整的参数,通常取1;
对于位置误差,其采用真实目标和候选框之间的SmoothL1损失,定义如下:
其中表示第i个候选框与类别k的第j个真实目标进行匹配;表示平滑L1范数,i∈Pos表示第i个正样本预测框;x,y,w,h分别表示候选框中心坐标以及其宽度和高度;是对g进行编码得到的;l表示对应于候选框的预测框的偏移量;g表示真实框;d表示候选框;
置信度误差是多类别置信度c的softmax损失,
中i∈Neg表示第i个正样本预测框;作为一个指示参数,当它为1时表示第i个候选框与第j个真实目标匹配,并且真实目标为P;指第i个候选框与第j个真实目标关于类别P匹配,则P的概率预测越高,损失越小;指预测框没有物体,则预测框作为背景的概率越高,损失越小,其中概率通过softmax产生。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111388223.6/1.html,转载请声明来源钻瓜专利网。





