[发明专利]一种改进的复杂背景遥感图像目标检测方法及系统在审
申请号: | 202210079252.2 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114463636A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 钮焱;郑新科;李军;何睦;同乐;赵慧;王子壬 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06K9/62;G06N3/04;G06N3/08;G06V10/25;G06V10/44;G06V10/774;G06V10/82 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 复杂 背景 遥感 图像 目标 检测 方法 系统 | ||
1.一种改进的复杂背景遥感图像目标检测方法,其特征在于,包括以下步骤:
步骤1:构建复杂背景遥感图像目标检测网络;
所述复杂背景遥感图像目标检测网络,包括特征提取网络、基于先验知识的锚框改进网络和基于IoU优化的锚框补选增强网络;
所述特征提取网络,以VoVNet作为基础网络,包括串联的3*3卷积层、并联的1*1卷积层,在VoVNet中进行串联的第一层卷积层之前与最后层卷积后级联残差结构和自注意力层;残差结构有一层卷积层conv1*1、批量归一化BN和激活函数leaky-relu;VoVNet连续的卷积层进行双向连接,既与后一层相连接,又在最后一个特征图一次性聚合所有特征;
所述基于先验知识的锚框改进网络,用于将特征提取网络输出的特征图使用调窗算法进行类型转化,提取有效的结构信息,然后提取先验信息;
所述基于IoU优化的锚框补选增强网络,用于设置一个与真实锚框A相同大小的假锚框B,S*是A与B的交集面积,则
步骤2:训练复杂背景遥感图像目标检测网络;
步骤3:将待测遥感图像输入训练好的复杂背景遥感图像目标检测网络中进行目标检测,得到目标检测结果。
2.根据权利要求1所述的改进的复杂背景遥感图像目标检测方法,其特征在于:步骤1中,所述特征提取网络,串联的3*3卷积层输入维度为64,输出维度为1024,并联的1*1卷积层输入维度为1024,输出维度为256;残差结构输入维度为64,输出维度为256;对于64维的图文特征向量,输入到3*3卷积层得到1024维的特征,同时经过残差结构输出256维的特征,1024维的特征再经过自注意力层后输入到并联的1*1卷积层,输出256维的特征。
3.根据权利要求1所述的改进的复杂背景遥感图像目标检测方法,其特征在于,步骤1中,所述特征提取网络的自注意力层,在自注意力层中特征图x的输入为c×h×w,c其是特征图的通道数,h是特征图的高度,w是特征图的宽度;特征图x先在h×w两个卷积核进行卷积,然后缩减特征图的通道数c1=c/8维度为c1×h×w的目标特征空间f(x)和维度为c1×h×w的目标特征空间g(x),第三次卷积得到维度为c×h×w的矩阵h(x);经过f(x)和g(x)的矩阵乘法,取得尺度特征矩阵Sij,再通过Softmax函数在列方向上进行尺度归一化,得到注意力矩阵βji:
Sij=f(xi)Tg(xi);
其中,N表示尺度特征图矩阵中元素的数量,j表示区域,i表示位置,xi表示原始输入特征图;对特征空间h和注意力矩阵进行矩阵乘法运算,最终得到自注意力特征图;输出注意力层表示为:
O=(O1,O2,O3...OI...ON)∈RC×N;
h(xi)=Whxi;
其中,Wh表示特征空间h的特征向量;
将权重加入自注意特征图,原始权重值为0,权重值的迭代由反向传播的神经网络完成:yi=γOi+xi;yi表示最终返回的特征图,γ表示自注意力特征图中初始值权重,初始值为0,Oi为展开后的自注意力特征图。
4.根据权利要求1所述的改进的复杂背景遥感图像目标检测方法,其特征在于,步骤1中,所述调窗算法是将特征图从第一个灰度自左向右进行面积累加,当累加的面积占到整个特征图面积的预设值时对应的灰度值作为窗位,然后设定固定窗宽;其中,将特征图的局部极小值点的灰度值作为窗底,然后搜索剩余值中的最大值,令其灰度值作为窗位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210079252.2/1.html,转载请声明来源钻瓜专利网。