[发明专利]一种基于Transformer的跨模态融合网络的RGB-D语义分割方法在审
申请号: | 202310401129.2 | 申请日: | 2023-04-15 |
公开(公告)号: | CN116452805A | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 葛斌;朱序;夏晨星;张梦格;卢洋;陆一鸣 | 申请(专利权)人: | 安徽理工大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/774;G06V10/82;G06V10/80;G06N3/084 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 232000 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 发明名称:一种基于Transformer的跨模态融合网络的RGB‑D语义分割方法摘要:本发明提供了一种基于Transformer的跨模态融合的RGB‑D语义分割方法,所述方法利用RGB图像和Depth图像的多模态数据,提取跨模态特征用于计算机视觉中的语义分割任务。本发明的贡献主要在于通过考虑Depth特征出发,意识到深度传感器获得的深度学习存在不可靠信息(如,一些深度传感器读取到的深色的物体或者反光的表面的读数往往不准确或者存在空洞),提出利用双边滤波来加强Depth特征的作用,并通过一个跨模态残差融合模块有效的融合RGB特征和Depth特征。通过提出的方法可以有效地处理RGB图像语义分割所遭遇的挑战(很难区分具有相似颜色和纹理的实例),并且可以有效的利用Depth图像。 | ||
搜索关键词: | 一种 基于 transformer 跨模态 融合 网络 rgb 语义 分割 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310401129.2/,转载请声明来源钻瓜专利网。
- 上一篇:燃气热水器
- 下一篇:一种自动化视觉场景建模的方法、装置、介质及电子设备
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法