[发明专利]一种基于注意力网络的遥感影像建筑物特征提取方法有效
申请号: | 202210810000.2 | 申请日: | 2022-07-11 |
公开(公告)号: | CN115063685B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 周亚男;汪顺营;冯莉;杨先增 | 申请(专利权)人: | 河海大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06N3/0464;G06N3/047;G06N3/08;G06V10/44;G06V10/80;G06V10/82 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王恒静 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 网络 遥感 影像 建筑物 特征 提取 方法 | ||
1.一种基于注意力网络的遥感影像建筑物特征提取方法,其特征在于,该方法包括:
首先,获取具有地物要素的遥感影像建筑物图片,并进行预处理,得到预处理后的图片;
其次,将大小为C×H×W的预处理后的图片输入至注意力网络中,所述注意力网络包括常规流、形状流和融合模块,所述常规流包括5个卷积块,每个卷积块结构相同,经过常规流后的特征图为二值语义图Fs,所述形状流的输入为常规流5个卷积块的输出特征图,大小分别为CHW*1/2i,将其上采样CHW大小后输入到4个串联的门控卷积层GCL后得到大小为1HW的二值边缘图Fe,0≤i≤4;
最后,将常规流和形状流分别得到的二值图Fs和Fe经过通道连接后输入到融合模块,经过卷积下采样遇上采样操作后,最终输出为大小为HW的目标二值语义图,该部分输出由常规流中使用的语义标签进行损失监督,从而得到边缘清晰的二值语义图。
2.根据权利要求1所述的基于注意力网络的遥感影像建筑物特征提取方法,其特征在于,每个卷积块包括编码器、注意力部分和解码器,所述常规流对图像的处理方法包括以下步骤:
(1)将预处理后的图片输入到编码器中,编码器包括5个编码层,除了第一个编码层,其余四个编码层都会将特征图的尺寸缩小二分之一,当输入特征图大小为CHW时,先经过第一个编码层依旧为C1HW,经过第二个编码层后尺寸为C2H/2W/2,经过第三个编码层后尺寸为C3H/22W/22,经过第四个编码层后尺寸为C4H/23W/23,经过第五个编码层后尺寸为C5H/24W/24,经过五个编码层后,尺寸变为原来的1/16,得到编码后的特征图Fe;
(2)所述注意力部分包括通道注意力模块、位置注意力模块、叠加模块,首先将特征图Fe经过一个1×1卷积,将通道维度数量从C5降为C’,空间维度尺寸不变得到C’H/24W/24的特征图Fi,输入到通道注意力模块中,得到与Fi同样大小的特征图Fo1,所述通道注意力模块用于使用特征通道挤压和激励处理输入的特征图;
(3)将大小为C5H/24W/24的特征图Fe先经过一个1×1卷积,将通道维度数量从C5降为C’,空间维度尺寸不变得到C’H/24W/24的特征图Fi,此处的Fi与步骤(2)的Fi是相同的,步骤(2)与步骤(3)的两个注意力是并行的,然后将其输入到位置注意力模块中,得到与Fi同样大小的特征图Fo2,所述位置注意力模块用于使用Criss-Cross Attention Module通过两次叠加得到像素的空间全局上下文信息;
(4)将特征图Fo1和特征图Fo2输入到叠加模块中,叠加模块采用short-cut结构融合特征图Fo1和特征图Fo2,最终得到大小为3*C’×H/24×W/24的输出特征图,所述叠加模块用于将不同输入的特征图在通道维度上进行叠加操作;
(5)将步骤(4)中得到的特征图Fleveli经解码块上采样为1HW大小的二值语义图Fs。
3.根据权利要求1所述的基于注意力网络的遥感影像建筑物特征提取方法,其特征在于,所述形状流由边缘标签对输出的二值边缘图进行损失监督。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210810000.2/1.html,转载请声明来源钻瓜专利网。