[发明专利]一种对高分辨率图像敏感的单目绝对深度估计方法在审
| 申请号: | 202211655768.3 | 申请日: | 2022-12-22 |
| 公开(公告)号: | CN115965676A | 公开(公告)日: | 2023-04-14 |
| 发明(设计)人: | 张陈涛;周煜全;邓连钧;陶金;张建寰;徐周毅 | 申请(专利权)人: | 厦门大学 |
| 主分类号: | G06T7/55 | 分类号: | G06T7/55;G06T3/40;G06N3/048;G06N3/09;G06N3/0455;G06N3/0464 |
| 代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 王婷婷 |
| 地址: | 361000 *** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 高分辨率 图像 敏感 绝对 深度 估计 方法 | ||
本发明提出一种对高分辨率图像敏感的单目绝对深度估计方法,将双目输入的图像通过数据水平拼接模块在垂直方向上进行拼接,在小数据集上训练的模型有更高的泛化能力和更高的预测精度;将图像输入模型,通过新型跳跃连接和深度解码器模块,提升深度估计在高分辨率下的敏感性,得到归一化的相对深度图;将相对深度图通过绝对尺度恢复模块得到具有真实深度的绝对尺度深度图。本发明方法改善了单目深度估计的尺度模糊、高分辨率精度提升小、小数据集泛化性差的问题,并且对于含有动态物体、遮蔽、相机静止的应用场景有较强的适应性。
技术领域
本发明涉及图像估计领域,特别是指一种对高分辨率图像敏感的单目绝对深度估计方法。
背景技术
深度估计被广泛运用于环境感知、场景理解、三维重建等领域,且在其中起到了关键作用。基于视觉的深度估计分为单目和多目的深度估计。单目深度估计相较于多目深度估计具有成本低、安装简易、数据获取容易等优点,是更具备挑战性和发展潜力的研究方向。目前主流的单目深度估计方法分为监督学习方法和自监督学习方法。基于监督学习的方法获取大量准确的深度真值是一个极大的挑战。因此,基于自监督学习的模型更接近于实际应用。但是,缺乏数据的数量和多样性是单目深度估计方法的一个棘手的问题,这会降低模型的泛化能力,并且自监督的单目深度估计存在固有的尺度模糊问题。同时,大多数将多帧图片作为输入的方法,对于含有动态物体、遮蔽、静止场景的深度估计效果较差。
目前,通过深度学习估计单目深度的方法大多对小数据集的泛化性差,对于高分辨数据的深度预测结果提升不大,并且大多无法恢复出绝对深度。
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种对高分辨率图像敏感的单目绝对深度估计方法,能够提升高分辨率相机下自监督单目深度估计的预测精度并预测出绝对深度,克服现有算法需要获取庞大数据集来进行自监督训练的缺点,并且对于含有动态物体、遮蔽、相机静止的应用场景有较强的适应性。
本发明采用如下技术方案:
一种对高分辨率图像敏感的单目绝对深度估计方法,包括:
在自监督单目绝对深度估计网络中输入单目图像序列/双目图像对,所述自监督单目绝对深度估计网络包括数据水平拼接模块,新型跳跃连接和深度解码器模块以及绝对尺度恢复模块;
输入图像通过数据水平拼接模块进行数据增强,利用重投影损失和多尺度像素平滑损失,构成自监督训练网络;
利用新型跳跃连接和深度解码器模块提取高分辨率特征,每一帧数据经过新型跳跃连接和深度解码器模块输出对应帧的相对深度图;
相对深度图通过绝对尺度恢复模块进行尺度恢复,得到含有绝对尺度的绝对深度图。
具体地,
所述数据水平拼接模块是将两对双目的输入图像进行部分地拼接,拼接方式由拼接率和相应的均匀概率确定;通过垂直拼接另一个输入图像中具有一定比例的区域来重构出新的输入图像,并随机垂直翻转这两个部分,得到拼接后的图像和拼接后垂直翻转的图像。
具体地,所述新型跳跃连接和深度解码器模块,其中新型跳跃连接结构由三种不同类型的节点组成;分别为特征提取节点,第一特征融合节点,第二特征融合节点,其中特征提取节点由残差块组成;第一特征融合节点具有3×3卷积运算;第二特征融合节点由全连接层和1×1卷积层组成;视差由深度网络decoder进行解码,该块包含3×3卷积和Sigmoid激活函数;通过密集跳跃连接,解码器中的每个节点都得到最终聚集特征图、中间聚集特征图和来自编码器的原始特征图。
具体地,所述绝对尺度恢复模块,具体包括:
计算曲面法线,为输入图像中的每个像素确定一个曲面法线;所有像素点需要投影到3D空间中,公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211655768.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





