[发明专利]一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法有效
申请号: | 202011055084.0 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112232151B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 王鑫;段林;吕国芳;严勤;石爱业 | 申请(专利权)人: | 河海大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06F17/16 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 周科技 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 嵌入 注意力 机制 聚合 神经网络 高分 遥感 场景 分类 方法 | ||
本发明公开了一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法,首先采用带注意力的迭代聚合模块对高分辨率遥感图像进行卷积、通道注意力筛选、融合得到图像的底层特征;其次将得到的底层特征通过卷积后送入下一个带注意力的迭代聚合模块提取图像的中层特征;然后将得到的中层特征通过卷积后送入最后一个带注意力的迭代聚合模块提取图像的高层特征;最后,将特征图通过池化层和全连接层对遥感场景图像进行分类。本发明利用带注意力的迭代聚合模块对遥感图像进行特征提取并融合,提取的特征涵盖具有较强的语义信息,同时,模块中嵌入了带注意力机制的结构,能有效筛选有用信息的通道进行融合,提高分类器的识别能力和分类性能。
技术领域
本发明属于图像处理领域,尤其涉及一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法。
背景技术
高分辨率遥感图像场景分类是根据遥感图像的内容,用一组语义类别对其进行标注。近年来,高分辨率遥感图像的场景分类因其在自然灾害探测、土地覆盖与土地利用分类、地理空间目标检测、地理图像检索、城市规划、环境监测等领域的广泛应用而变得越来越重要。在早期的工作中,手工制作的特征在这项工作中应用最为广泛,并得到了深入的研究,如颜色直方图、尺度不变特征变换(SIFT)和方向梯度直方图(HOG)。这些方法严重依赖专业技能和领域专业知识来设计各种特征,使得它们的适应性和表达能力不够强。同时,这些方法通常需要中间层的编码器作为辅助,如著名的视觉单词包(BoVW)、fisher矢量(FV)编码和空间金字塔匹配(SPM)。但是,随着这项工作的难度越来越大,上述方法已经不能满足需求。
在深度神经网络强大的特征学习能力的推动下,由深度学习驱动的遥感图像场景分类引起了人们的极大关注,并取得了重大突破。鉴于这一领域的迅速发展,基于深度学习的高分辨率遥感图像场景分类方法主要有:(1)基于自动编码器的场景分类方法;(2)基于卷积神经网络的场景分类方法;(3)基于生成对抗网络的场景分类方法。
公开号CN108399366A一种遥感图像场景的分类系统,包括采集步骤、灰度处理器、拟合步骤、边缘检测步骤、遥感图像像素分类步骤及神经网络训练器;通过对原始遥感图像进行采集作为样本并传输给灰度处理器,接着采用分量法进行灰度化处理,然后采用低次样条函数对灰度直方图进行拟合,最后采用基于零交叉的方法找到由图像得到的二阶导数的零交叉点来定位边缘。所述的方法采用基于像元的方法对遥感图像分类,能够很好地对遥感图像场景进行分类,但是,该分类方法采用的大多是传统手工特征提取的算法,分类步骤繁琐,且在分类的决策边界处难以判定所属类别。
Li等人在2019年IEEE 4th International Conference on Signal and ImageProcessing上发表论文“Classification of Remote Sensing Scenes Based on NeuralArchitecture Search Network”,该文献针对网络模型的自动设计问题,提出了一种基于神经网络的遥感场景分类方法。进一步利用迁移学习技术,使所设计的网络能够很好地迁移到遥感场景分类数据集中。由于该方法采用神经网络架构搜索的方法,使得训练的工作变得非常麻烦,且实现该分类方法对硬件资源的要求极高,同时训练出的的神经网络架构具有偶然性,泛化能力受数据影响。
综上,一般的遥感图像场景分类方法,存在的诸多局限性主要表现在:
(1)特征提取过程复杂:传统的分类方法采用分治的思想,需要人为设计图像特征的提取算法,提取图像的各种类型的特征,其中特征提取过程算法复杂,且提取的特征可能存在信息丢失冗余等现象,从而导致分类准确率不高;
(2)特征表达能力不强:传统遥感图像场景分类方法通常仅用一种或两种类型的特征作为分类器的输入,当场景图像存在畸变、模糊、类别不一等情形,特征表达能力受限,从而弱化了分类性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011055084.0/2.html,转载请声明来源钻瓜专利网。