[发明专利]基于注意力机制与多尺度特征的遥感图像建筑物分割方法有效
申请号: | 202110779969.3 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113298818B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 刘艳;刘全德;魏凯;李文波;刘新彪;张永飞 | 申请(专利权)人: | 大连大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/80;G06V10/82;G06N3/0464;G06N3/048;G06N3/08;G06T7/10;G06T7/13 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 刘鑫 |
地址: | 116622 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 尺度 特征 遥感 图像 建筑物 分割 方法 | ||
本发明公开了一种基于注意力机制与多尺度特征的遥感图像建筑物分割方法,涉及遥感影响建筑物提取技术领域,构建包括编码器、中间层、解码器的语义分割网络模型FAME‑Net;在编码阶段将通道注意力机制和空间维度注意力机制进行融合;在编码器与解码器之间的中间层增设锚点特征增强的空间金字塔池化C‑ASPP模块;在解码阶段进行多尺度特征融合并引入平均损失函数;能够提高对小型建筑物特征的提取能力,有效利用图像多尺度特征,提高分割目标精度。
技术领域
本发明涉及遥感影响建筑物提取技术领域,具体涉及一种基于注意力机制与多尺度特征的遥感图像建筑物分割方法。
背景技术
近年来,随着城市化进程的不断加快,高分辨率遥感影像建筑物提取在城市规划、人口估算和智慧城市三维重建等方面越发重要。遥感影像受拍摄角度、阳光、云、建筑物附近道路植被等因素的影响,具有相对复杂的语义特征,因此,遥感影像建筑物的分割已成为高分辨率遥感图像分割中最具挑战性的任务之一。
作为像素级的分割问题,建筑物分割的核心是特征提取,常用方法大致可分为两类:一是基于人工提取特征,二是基于深度学习自动提取特征。
人工特征提取基于边缘、阈值或区域,利用几何形状、光谱特性、纹理、颜色、阴影等信息进行特征提取,分割图像,该类方法只利用地面目标的浅层特征,未涉及复杂建筑物深层的多尺度特征,提取精度较低。
随着深度学习的快速发展,卷积神经网络自动提取特征优势在图像分类、目标检测和语义分割等方面表现尤为突出,正逐渐取代传统人工提取特征方法。Alshehhi等人基于卷积神经网络图像块分类方法自动学习和提取道路及建筑物特征,分割中块状区域会产生模糊锯齿状边缘,全连接层使批处理操作过程存在大量冗余计算,占用内存大。Long等人在2015年首次提出全卷积神经网络FCN(Fully Convolutional Networks)图像语义分割架构,在遥感图像语义分割领域取得了突破性进展,该架构用卷积层代替了卷积神经网络中的全连接层,有效减少了冗余计算,通过反卷积实现语义分割,消除了图像块分割方法中块状区域带来的锯齿状边缘,但空间信息损失严重,对图像中的细节不敏感。因此,Ronneberger等人在FCN的基础上提出了一种用于医学图像分割的U-Net架构,在FCN基础上增加跳跃连接拼接深层和浅层图像特征,解决FCN网络信息损失严重问题,在建筑物提取任务中表现出较大潜力,但U-Net仅关注如何更好恢复特征图的分辨率,忽略了深层次特征的获取。Chaurasia等人为提取深层次特征,在传统的U-Net中引入了ResNet18,直接连接编码器与解码器,构建一种具有实时性的轻量级网络,但忽略了图像的多尺度信息。Zhou等人提出了D-LinkNet模型,在LinkNet基础上加入并联空洞卷积层,执行道路提取任务,在不损失分辨率的同时增大感受野,提高了挖掘全局上下文信息的能力,但仍存在错误分割和分割连续性差问题。遥感图像语义分割实际上是二分类问题,大量研究表明,编码-解码器网络更适用于遥感图像分割,上述U-Net、LinkNet、D-LinkNet等网络在遥感图像分割领域取得了一定成果,分割精度也在逐步提高,但这些网络对小型建筑物分割效果并不理想,也未考虑建筑物集群间的边界粘连的问题。
发明内容
为解决现有技术中存在的各问题,本发明提供一种基于注意力机制与多尺度特征的遥感图像建筑物分割方法,能够提高对小型建筑物特征的提取能力,有效利用图像多尺度特征,提高分割目标精度。
本发明为解决其技术问题所采用的技术方案是:一种基于注意力机制与多尺度特征的遥感图像建筑物分割方法,构建包括编码器、中间层、解码器的语义分割网络模型FAME-Net;在编码阶段将通道注意力机制和空间维度注意力机制进行融合;在编码器与解码器之间的中间层增设锚点特征增强的空间金字塔池化C-ASPP模块;在解码阶段进行多尺度特征融合并引入平均损失函数。
进一步的,所述编码器采用不含全连接层的恒等映射残差网络获取深层次特征,在编码器中对通道注意力机制和空间维度注意力机制进行级联融合后得到的融合注意力机制添加至所述残差网络的每层残差单元后。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110779969.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:充电桩散热系统和充电桩
- 下一篇:一种空气净化器