[发明专利]基于Transformer的热红外图像立体匹配方法及装置在审
申请号: | 202210095475.8 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114445480A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 李成龙;贾雅晴;朱启文;蔡先琛;汤进 | 申请(专利权)人: | 安徽大学 |
主分类号: | G06T7/593 | 分类号: | G06T7/593;G06K9/62;G06V10/75;G06V10/46;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 闫客 |
地址: | 230039 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 transformer 红外 图像 立体 匹配 方法 装置 | ||
1.一种基于Transformer的热红外图像立体匹配方法,其特征在于,所述方法包括:
获取热红外图像校正后的左视图和右视图;
采用UNet特征提取网络对所述左视图和所述右视图进行特征提取,得到多尺度特征图,所述多尺度特征图包括分别与所述左视图和所述右视图对应的多尺度特征图;
基于Transformer特征转换模块对所述多尺度特征图进行处理,得到所述左视图的转换特征图和所述右视图的转换特征图;
基于所述左视图的转换特征图和所述右视图的转换特征图,生成视差图。
2.如权利要求1所述的基于Transformer的热红外图像立体匹配方法,其特征在于,所述Transformer特征转换模块包括位置编码模块和注意力模块,所述多尺度特征图作为所述位置编码模块的输入,所述位置编码模块的输出作为所述注意力模块的输入,所述位置编码模块用于将所述多尺度特征图与所述多尺度特征图经过二维卷积后的特征图相加;
所述注意力模块包括依次连接的自注意力层和互注意力层。
3.如权利要求2所述的基于Transformer的热红外图像立体匹配方法,其特征在于,所述注意力模块实现注意力机制的公式表示如下:
Attention(Q,K,V)=φ(Q)φ(K)TV
其中,Attention()为注意力函数,Q为注意力层的输入向量Query,K为注意力层的输入向量Key,V为注意力层的输入向量Value,φ(·)=elu(·)+1。
4.如权利要求1所述的基于Transformer的热红外图像立体匹配方法,其特征在于,所述基于所述左视图的转换特征图和所述右视图的转换特征图,生成视差图,包括:
基于所述左视图的转换特征图和所述右视图的转换特征图,构造四维代价体;
将所述四维代价体经三维卷积进行代价聚合,得到不同尺度的聚合代价体;
利用视差回归方程,对不同尺度的所述聚合代价体进行估算,得到所述视差图。
5.如权利要求4所述的基于Transformer的热红外图像立体匹配方法,其特征在于,所述视差回归方程的公式表示如下:
其中,cd为预测代价,σ()为softmax函数,d为视差值,为预测视差值,Dmax为最大视差。
6.一种基于Transformer的热红外图像立体匹配装置,其特征在于,所述装置包括:
获取模块,用于获取热红外图像校正后的左视图和右视图;
特征提取模块,用于采用UNet特征提取网络对所述左视图和所述右视图进行特征提取,得到多尺度特征图,所述多尺度特征图包括分别与所述左视图和所述右视图对应的多尺度特征图;
Transformer特征转换模块,用于基于Transformer特征转换模块对所述多尺度特征图进行处理,得到所述左视图的转换特征图和所述右视图的转换特征图;
视差图生成模块,用于基于所述左视图的转换特征图和所述右视图的转换特征图,生成视差图。
7.如权利要求6所述的基于Transformer的热红外图像立体匹配装置,其特征在于,所述Transformer特征转换模块包括位置编码模块和注意力模块,所述多尺度特征图作为所述位置编码模块的输入,所述位置编码模块的输出作为所述注意力模块的输入,所述位置编码模块用于将所述多尺度特征图与所述多尺度特征图经过二维卷积后的特征图相加;
所述注意力模块包括依次连接的自注意力层和互注意力层。
8.如权利要求7所述的基于Transformer的热红外图像立体匹配装置,其特征在于,所述注意力模块实现注意力机制的公式表示如下:
Attention(Q,K,V)=φ(Q)φ(K)TV
其中,Attention()为注意力函数,Q为注意力层的输入向量Query,K为注意力层的输入向量Key,V为注意力层的输入向量Value,φ(·)=elu(·)+1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210095475.8/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序