[发明专利]一种Transformer图像道路检测方法在审
申请号: | 202210346629.6 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114937257A | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 付希凯;魏晓晨;吕孝雷 | 申请(专利权)人: | 中国科学院空天信息创新研究院 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/26;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 李爱英 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 transformer 图像 道路 检测 方法 | ||
本发明公开了一种Transformer图像道路检测方法,能够充分利用多时相信息和能够建立全图像像素与像素之间的空间依赖关系,实现图像道路的准确检测。本发明分层提取得到总图像特征后,将每层的总图像特征输入到时空Transformer模型中,得到每层的模型特征,进而得到增强特征;解码后将所有解码结果从后至前依次叠加,得到恢复特征;分割网络分割恢复特征,得到道路检测结果。本发明基于深度学习,克服了传统的SAR图像道路检测方法由于SAR图像中复杂的环境无法对SAR图像中的道路进行精确建模的缺点;本发明基于深度学习采用数据驱动的方式对SAR图像中的道路对象进行学习,有效地避免了对SAR图像中的对象进行建模,取得了比传统方法更好的效果。
技术领域
本发明涉及SAR图像道路检测技术领域,具体涉及一种Transformer图像道路检测方法。
背景技术
早期,SAR的道路检测方法将道路建模为被明亮边缘包围的暗黑色区域。根据这个前提,早期的SAR图像道路检测方法首先根据SAR图像中道路特点从 SAR图像中提取特征。提取的特征包括:线性特征、对比度特征、灰度特征和方向特征。之后根据提取的特征进行二值化,检测出SAR图像中的道路。
然而,在现实世界中由于各种干扰的存在、道路类型的多样性以及环境背景的复杂性,所建立的道路模型往往是无效的,这就给传统的SAR图像道路提取方法造成了瓶颈。
影响现有的SAR图像道路检测方法性能提升的一个重要因素是相干斑噪声。为了减轻相干斑噪声的影响,现有的单时相道路检测方法通常在预处理阶段采用各种空域滤波的方法消除相干斑噪声。虽然空域滤波的方法可以在一定程度上消除相干斑噪声,然而空域滤波方法也造成了空间分辨率的降低。SAR图像相较于光学图像具有全天时全天候的特点,近年来SAR卫星的重访周期越来越短,可以在一段很短的时间内拍摄同一地区的多幅影像。于是近年来出现了很多采用多时相SAR图像进行道路检测的方法。这些方法主要在预处理阶段采用各种时域滤波的方法,去除相干斑噪声,在道路检测阶段仍然只使用单视幅图像,这样的方法忽略了道路对象的特点。在遥感图像中,道路是一种不轻易变化的对象,在一个很短的时间内,不同时间拍摄的SAR图像中的道路对象具有一致性,因此只在预处理阶段多时相信息的方法造成了信息损失。除了时间信息外,空间信息对从SAR图像中检测道路也十分重要。为了能够获得更多的空间信息,大多数方法采用膨胀卷积、空间金字塔模型等方法通过扩大感受野来获得更多的空间信息,然而这类方法不能够建立全图像像素的空间依赖关系。
总之,现有的多时相SAR图像道路检测方法只在预处理阶段利用多时相信息,忽略了SAR图像中道路的时间一致性,造成了信息损失。现有的方法大多采用膨胀卷积和空间金字塔模型来获得更多的空间信息,然而这些方法并不能获得全图像像素与像素之间的空间依赖性关系。
因此,目前亟需一种图像道路检测方法,能够充分利用多时相信息,建立全图像像素与像素之间的空间依赖关系。
发明内容
有鉴于此,本发明提供了一种Transformer图像道路检测方法,能够充分利用多时相信息和能够建立全图像像素与像素之间的空间依赖关系,实现图像道路的准确检测。
为实现上述发明目的,本发明的技术方案为:
一种Transformer图像道路检测方法,通过卫星获取多时相SAR图像作为原始图像,采用如下具体步骤进行道路检测:
步骤一、构建多层编码块,利用编码块分层提取原始图像的特征。
步骤二、将所提取的每一层特征根据时间轴组合并进行矩阵变换,得到每一层编码块对应的每层的总图像特征。
步骤三、将每层的总图像特征输入到时空Transformer模型中,得到每层的模型特征;将每层的模型特征与同一层的总图像特征相加,得到该层的增强特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院,未经中国科学院空天信息创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210346629.6/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序