[发明专利]一种基于高空间分辨率光学遥感图像的建筑物实例自动提取方法有效
申请号: | 202110225303.3 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112883887B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 李军;刘小雪;陈一平;马凌飞;李海峰 | 申请(专利权)人: | 中央财经大学 |
主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V10/25;G06V10/26;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 范盈 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空间 分辨率 光学 遥感 图像 建筑物 实例 自动 提取 方法 | ||
1.一种基于高空间分辨率光学遥感图像的建筑物实例自动提取方法,其特征在于,所述方法包括如下步骤:
1)自动预处理二值标注图像得到COCO注释数据;
2)输入光学遥感图像,构建语义特征金字塔;
3)根据所述语义特征金字塔筛选有建筑物的区域,对所述区域进行筛选生成候选建筑物边界框;
4)根据所述边界框补充全局空间信息,预测建筑物边界框准确位置,预测建筑物掩码覆盖区域;所述步骤2)通过高分辨率网络提取高分辨率特征并构建语义特征金字塔;所述高分辨率网络包括1组高分辨率卷积网络和3组低分辨率卷积网络经4个阶段并行连接,低分辨率特征经双线性插值被上采样为高分辨率特征后,4种分辨率混合特征通过平均池化被下采样到多个层次构建语义特征金字塔;所述步骤3)在区域建议网络中利用所述语义特征金字塔输出的每个特征图引导并构造自适应建筑物大小和纵横比的引导锚以筛选有建筑物的图像区域;所述引导锚根据联合条件概率公式构建,包括锚生成模块和特征自适应模块;所述锚生成模块预测锚中心和锚形状,将所述锚中心和所述锚形状结合生成锚;所述特征自适应模块对原始特征图应用带偏移的可变形卷积生成新特征图以适配锚形状变化;步骤3)区域分类、回归以筛选生成候选建筑物边界框时分类损失函数为焦点函数以平衡建筑物和背景像素数量极端差异;
所述引导锚联合条件概率公式定义为:
p(x,y,w,h|FI)=p(x,y|FI)p(w,h|x,y,FI)
对于特征金字塔中输出的每个特征图FI,锚的中心位置(x,y),锚的形状,w为宽度,h为高度,根据p(x,y,w,h|FI)公式原理构建引导锚模块包括锚生成模块和特征自适应模块,锚生成模块中的NL和NS分支分别预测锚的中心位置和形状再结合生成锚,锚生成参数在所有涉及的特征级别上共享,特征自适应模块对原始特征图应用带偏移的可变形卷积,使新特征图适配锚形状变化供后续的预测即锚的进一步分类和回归,
锚的中心位置预测分支NL,输出与特征图FI相同分辨率的单通道映射,表示每一个像素位置是锚中心位置的概率p(·|FI),输出位置(i,j)对应原图位置变换公式为:
((i+0.5)s,(j+0.5)s)
其中s是特征图FI的步长,
锚的形状预测分支NS输出与特征图FI相同分辨率的双通道映射,表示每一个位置与最近的地面真值边界框重叠最多的形状(w,h),
可变锚与地面真值边界框之间的IOU,记作vIoU:
其中,IoUmormal为经典的IoU定义,(w,h)为变量,
输出(w,h)需要经过非线性变换以稳定预测值;
通过选择预测概率高于某个阈值的位置和每个位置上最可能的形状来生成一组锚,由于锚形状可能不同,不同位置的特征应该捕获不同范围内的视觉内容,特征自适应模块NT,根据基础锚形状预测每一个位置偏移,再对带有偏移量的原始特征图FI应用可变形卷积附加锚的形状信息输出供后续对应锚的回归、分类,特征自适应转换公式为:
f′i=NT(fi,wi,hi)
其中,fi是第i个位置的特征,(wi,hi)是对应的锚形状;RPN阶段除传统的分类损失和回归损失以外,还需要额外学习锚位置损失和锚形状损失:
其中,为smooth L1 loss,(w,h)和(Wg,hg)代表预测锚形状和相应的地面实况bbox的形状,λ1和λ2是平衡位置和形状预测分支系数;
设置λ1=15和λ2=0.1以平衡位置和形状损失权重,
改进引导锚模块中分类损失为Focal函数以平衡样本难易分类权重;
在建筑物提取任务中,背景类的像素通常远多于建筑物类的像素,且不同尺度的建筑物样本数量往往存在显著差异,尤其是异构建筑物样本数量少且难以训练;背景类的像素通常远多于建筑物类的像素;大量容易分类的负样本可能主导梯度进而导致模型退化,是RPN阶段分类性能和速度提升的主要阻碍,将Focalloss作为RPN的分类损失函数不仅可以缓解建筑物类和背景类极端不平衡,而且可以减少易分类样本的权重使模型在训练时更加关注难分类样本,
基于Cross Entropy Loss改进的Focal Loss被定义为:
CE(pt)=-log(pt).
FL(pt)=-αt(1-pt)γlog(pt).
其中,y∈{±1}是地面实况类别;p∈[0,1]是类别概率;α∈[0,1]是平衡正/负样本的权重因子;(1-pt)γ是减少易分类样本权重的调制因子,当pt→1时,(1-pt)γ→0),γ≥0是平滑权重调整过程的聚焦参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中央财经大学,未经中央财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110225303.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水箱结构及装配其的蒸烤箱
- 下一篇:一种实时去雾显示挡风玻璃装置