[发明专利]基于空洞特征金字塔网络的光学遥感图像目标检测方法有效

专利信息
申请号: 201911271302.1 申请日: 2019-12-12
公开(公告)号: CN111126202B 公开(公告)日: 2022-03-04
发明(设计)人: 应翔;申继宁;高洁;刘志强;于健;李雪威;喻梅;于瑞国 申请(专利权)人: 天津大学
主分类号: G06V20/13 分类号: G06V20/13;G06V10/25;G06V10/56;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 天津盛理知识产权代理有限公司 12209 代理人: 霍慧慧
地址: 300071*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 空洞 特征 金字塔 网络 光学 遥感 图像 目标 检测 方法
【权利要求书】:

1.一种基于空洞特征金字塔网络的光学遥感图像目标检测方法,其特征在于:所述方法的步骤为:

S1:将所采用的图像数据集划分成80%用于网络模型训练的训练集、20%用于模型测试的测试集,尽量保持训练集和测试集中不同类别样本的数据分布一致性;

S2:对数据集中的光学遥感图像进行尺寸变换、标准化与归一化处理,并且进行训练集的数据增强;

S201、在S1的基础上对数据集中的图像进行预处理,对所采用的数据集进行尺寸变换,将输入图像的最短和最长边分别设置为600和1000像素;

S202、根据划分的训练集算出所选取数据集的RGB均值,并对训练集和测试集中所有样本执行减去RGB均值的操作,来凸显图像中个体之间的特征差异;

S203、对数据集中的图像进行图像标准化和归一化处理:根据凸优化理论和数据概率分布相关知识,通过去均值操作对数据进行中心化处理,实现图像的标准化处理;通过将图像中每个像素值映射到0~1范围之内,实现图像的归一化处理;

S204、采用简单的水平翻转和随机裁剪操作对数据进行增强,从而增加训练集的训练样本数量,保证目标检测模型的鲁棒性;

S3:利用空洞卷积构造空洞特征金字塔网络,并利用训练集中的图像进行网络模型的训练;

S301、构建空洞特征金字塔网络,选取ResNet-101作为目标检测网络的基础网络,该ResNet-101利用残差块进行具有不同尺度的特征图的提取,从ResNet-101基础网络中抽取后面四个卷积块的最后一个残差结构的输出作为基本特征,并将这些基本特征图表示为{C2,C3,C4,C5};

S302、在金字塔网络的空洞特征融合模块AFFM中,C2通过Conv1×1来将特征通道数减少到256维,{C3,C4,C5}分别通过上采样操作来将每个特征图双线性插值到C2特征图的大小,并通过Conv1×1操作将上采样后的特征图通道数降到256维,然后通过Concat操作将上面得到的特征图串联到一起,得到多层级融合特征,再应用Conv1×1来将多层级融合特征的特征维度降到256维;

S303、构造空洞横向连接模块,采用Conv1×1,Conv3×3,Conv5×5这三种卷积操作使空洞横向连接模块三个分支具有不同大小的感受野,在这三个分支后面加上具有不同空洞率的Conv3×3操作,并将每个分支产生的特征图与Global Average Pooling分支共同通过Concat操作拼接在一起,从而得到具有较强多尺度表达能力的横向连接特征图;

S304、融合后的特征图经过多层下采样及空洞横向连接模块来自下而上地生成多组具有不同尺度的特征图,并将这些特征图表示为{P2,P3,P4,P5},分别对应于{C2,C3,C4,C5},具体地,利用通道串联操作将多层级融合特征产生的特征与空洞横向连接模块产生的特征整合到一起,并通过Conv1×1操作得到{P2,P3,P4,P5},这些特征图的计算函数为:

其中:Pi为输入到检测网络头部用以预测结果的多层级特征;

ALCB(Ci)为具有不同大小的卷积核和空洞率的多分支卷积运算函数;

Conv3×3(Pi-1)为卷积核大小为3×3,步幅大小为2的卷积运算,即对Pi-1进行下采样操作;

S305、将空洞特征融合模块生成的{P2,P3,P4,P5}输入到网络模型后面的区域生成网络以及检测网络头部中来进一步进行候选区域的生成与检测结果的计算;

S306、利用得到的训练集对构建的空洞特征金字塔网络进行训练,采取近似联合训练策略:网络模型总共训练了100K次迭代,前60K次迭代的学习率为10-3,接下来的20K次迭代的学习率为10-4,重量衰减和动量分别为0.00004和0.9;

S4:利用训练好的目标检测模型对遥感图像进行检测,并进行检测效果的分析与对比;将获得的检测结果通过非极大值抑制操作进行去重,非极大值抑制的IoU阈值设定为0.7,选取mAP作为衡量遥感图像目标检测效果的评价指标,其中IoU阈值设置为0.5。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911271302.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top