[发明专利]一种基于多尺度残差网络模型的高分影像建筑物提取方法有效
申请号: | 202110434612.1 | 申请日: | 2021-04-22 |
公开(公告)号: | CN113205018B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 眭海刚;杜卓童;李强;段志强;肖昶;王海涛;王挺;程旗;冯文卿 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/46;G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 网络 模型 高分 影像 建筑物 提取 方法 | ||
本发明公开了一种基于多尺度残差网络模型的高分影像建筑物提取方法。首先,对高分辨率遥感影像中的典型建筑物类型和特征做出分析,基于深度学习网络大量数据需求设计数据增广策略,确定训练样本集和验证样本集的超参数配比;其次,在U‑Net网络对称结构的基础单元中结合密集捷径结构,设计残差映射单元,并对基本单元中卷积层结构安排进行改进,利于模型训练;同时,该改进网络将影像输入阶段设计为特征金字塔输入结构,可在不同尺度上学习影像特征,结合设计的残差跳跃连接方式进行多尺度特征融合,通过多级残差单元运算细化建筑物分割结果,加强了不同网络层之间多级特征的重用性,有效地增强了梯度在网络中的传递,加速模型收敛。
技术领域
本发明涉及遥感应用技术领域,尤其是涉及一种基于多尺度残差网络模型的高分影像建筑物提取方法。
背景技术
建筑物作为构成城市结构的基本要素之一,其智能提取方法对于城市规划、监测以及管理来说是一项至关重要的任务,对于城市发展分析也有着重要的应用价值。相较于中低分辨率遥感影像,利用高分辨遥感影像进行建筑物变化检测的优势在于:图像包含更丰富的地物信息,如人工建筑在中低分辨率遥感影像中表现为点目标,而在高分辨率影像中会变成明显的面目标,这些目标占据了更多的像素;同一类地物的空间结构、纹理等表征信息更加丰富,这些信息能够更好的反映同一类地物的局部特征以及内部细节差异。但高分辨率遥感影像在带来了丰富的细节信息的同时放大了在中低分辨率遥感影像中较细微、可以忽略的干扰信息,形成影响建筑物检测新的干扰因素。虽然影像空间分辨率的提高缓解了低分辨率传感器的混合像元问题,但同一建筑对应的区域内部由于建筑物材料的不同在光谱响应上差异较大。复杂背景下的建筑物目标结构多变,高低错落,往往又易与周边的树木、道路等地物相混淆,“同谱异物,同物异谱”现象显著,加大了建筑物提取难度。建筑物复杂的结构体现出来的高程不连续、影像中相对遮蔽更加严重以及阴影的影响都是对建筑物检测而言更加严峻的挑战。
近年来,随着计算机计算能力和深度学习算法的发展,以卷积神经网络为基础的目标检测识别、图像语义分割逐渐超过了传统算法的最好效果,端到端的深度网络训练方法大幅提高了遥感图像中建筑物目标提取的准确率。其中,基于深度编码-解码网络的方法已经在建筑物提取中得到了广泛的应用。这类网络的编码部分主要用于提取深度抽象的特征,常见的编码网络部分大多采用了经典的网络模型,例如VGGNet、ResNet以及DenseNet等,抛弃了全连接层,在这些网络中输入的图像块经过多次池化操作,网络中间的特征图尺寸经过多倍压缩。网络的解码部分主要用于从编码部分获取的特征进行学习,将图像进行恢复,得到建筑物预测标记影像。目前,绝大多数网络都采取了上采样和跳跃连接结构,将底层学习的特征传递到高层,用于解码网络恢复图像中损失的细节信息。但是,简单的将编码器部分提取的特征图直接连接在对称的编码器部分并不能充分利用多层级中的特征信息,建筑物目标的细节位置信息仍然得不到有效恢复。此外,深度模型往往对显存和硬件条件的限制过高,如何提升目标提取的效率,均衡精度与计算代价也是另一个主要问题。
发明内容
针对现有技术存在的问题,本发明采用多级特征整合与多尺度特征融合的策略,设计了多尺度残差链接网络模型,目的是解决由于深度网络中池化操作造成的建筑物细节信息丢失的问题,利用丰富的多尺度上下文特征信息实现更精细的建筑物分割。同时,本发明构建的深度网络模型可减少模型训练参数和内存的要求。
本发明的技术方案为:一种基于多尺度残差网络模型的高分影像建筑物提取方法,包括以下步骤:
步骤一,根据高分辨率遥感影像中典型的建筑物区域,分析不同类型与风格的建筑物影像特征,基于数据增广策略扩充样本,并确定训练集和验证集的超参数配比;
步骤二,基于卷积神经网络基本对称结构、密集捷径结构、残差跳跃连接方式与特征金字塔输入结构,设计多尺度残差连接深度网络整体模型结构,包括以下子步骤;
步骤2.1,多尺度残差连接深度网络整体包括编码器部分和解码器部分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110434612.1/2.html,转载请声明来源钻瓜专利网。