[发明专利]一种基于注意力网络的遥感影像建筑物特征提取方法有效
申请号: | 202210810000.2 | 申请日: | 2022-07-11 |
公开(公告)号: | CN115063685B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 周亚男;汪顺营;冯莉;杨先增 | 申请(专利权)人: | 河海大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06N3/0464;G06N3/047;G06N3/08;G06V10/44;G06V10/80;G06V10/82 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王恒静 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 网络 遥感 影像 建筑物 特征 提取 方法 | ||
本发明公开了一种基于注意力网络的遥感影像建筑物特征提取方法,该方法包括:获取具有地物要素的遥感影像建筑物图片,并进行预处理,得到预处理后的图片;将预处理后的图片输入至注意力网络中,常规流包括5个卷积块,每个卷积块结构相同,经过常规流后的特征图为二值语义图Fs,形状流的输入为常规流5个卷积块的输出特征图;将常规流和形状流分别得到的二值图Fs和Fe经过通道连接后输入到融合模块,经过卷积下采样遇上采样操作后,最终输出为大小为HW的目标二值语义图,该部分输出由常规流中使用的语义标签进行损失监督,从而得到边缘清晰的二值语义图。本发明改进传统的注意力机制,使得可以采用更小的网络结构提高遥感影像建筑物提取的效果。
技术领域
本发明涉及一种特征提取技术领域,具体涉及一种基于注意力网络的遥感影像建筑物特征提取方法。
背景技术
目前的遥感影像建筑物提取方法存在自注意力机制中参数过多和GPU内存占用高的问题。
发明内容
发明目的:为了克服现有技术的不足,本发明提供一种基于注意力网络的遥感影像建筑物特征提取方法,该方法解决了上述的技术问题。
技术方案:本发明提供基于注意力网络的遥感影像建筑物特征提取方法,该方法包括:
首先,获取具有地物要素的遥感影像建筑物图片,并进行预处理,得到预处理后的图片;
其次,将大小为C×H×W的预处理后的图片输入至注意力网络中,所述注意力网络包括常规流、形状流和融合模块,所述常规流包括5个卷积块,每个卷积块结构相同,经过常规流后的特征图为二值语义图Fs,所述形状流的输入为常规流5个卷积块的输出特征图,大小分别为CHW*1/2i,将其上采样CHW大小后输入到4个串联的门控卷积层GCL后得到大小为1HW的二值边缘图Fe,0≤i≤4;
最后,将常规流和形状流分别得到的二值图Fs和Fe经过通道连接后输入到融合模块,经过卷积下采样遇上采样操作后,最终输出为大小为HW的目标二值语义图,该部分输出由常规流中使用的语义标签进行损失监督,从而得到边缘清晰的二值语义图。
进一步的,包括:
每个卷积块包括编码器、注意力部分和解码器,所述常规流对图像的处理方法包括以下步骤:
(1)将预处理后的图片输入到编码器中,编码器包括5个编码层,除了第一个编码层,其余四个编码层都会将特征图的尺寸缩小二分之一,当输入特征图大小为CHW时,先经过第一个编码层依旧为C1HW,经过第二个编码层后尺寸为C2 H/2W/2,经过第三个编码层后尺寸为C3 H/22W/22,经过第四个编码层后尺寸为C4 H/23W/23,经过第五个编码层后尺寸为C5 H/24W/24,经过五个编码层后,尺寸变为原来的1/16,得到编码后的特征图Fe;
(2)所述注意力部分包括通道注意力模块、位置注意力模块、叠加模块,首先将特征图Fe经过一个1×1卷积,将通道维度数量从C5降为C’,空间维度尺寸不变得到C’H/24W/24的特征图Fi,输入到通道注意力模块中,得到与Fi同样大小的特征图Fo1,所述通道注意力模块用于使用特征通道挤压和激励处理输入的特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210810000.2/2.html,转载请声明来源钻瓜专利网。