[发明专利]深度估计方法、模型训练方法、装置、设备及存储介质在审
| 申请号: | 202110396926.7 | 申请日: | 2021-04-13 |
| 公开(公告)号: | CN112991416A | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 董怀琴;吴宇斌;尹康;王慧;朱志鹏 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
| 主分类号: | G06T7/50 | 分类号: | G06T7/50;G06N3/04;G06N3/08 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢惠童 |
| 地址: | 523860 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 深度 估计 方法 模型 训练 装置 设备 存储 介质 | ||
本申请实施例提供了一种深度估计方法、模型训练方法、装置、设备及存储介质,涉及计算机视觉技术领域。所述方法包括:获取原始图像;调用深度估计模型;通过深度估计模型对原始图像进行深度值估计,得到原始图像的估计深度值集合;其中,深度估计模型的损失函数包括深度损失函数和/或梯度损失函数,深度损失函数用于表征基于深度估计模型输出的估计深度值和真实深度值之间的差异程度,梯度损失函数用于表征估计深度值的梯度和真实深度值的梯度之间的差异程度,估计深度值的梯度基于估计深度值和步长确定,真实深度值的梯度基于真实深度值和步长确定。本申请实施例的深度估计模型增加了对平面的约束,使得预测的图像的深度值更加准确。
技术领域
本申请实施例涉及计算机视觉技术领域,特别涉及一种深度估计方法、模型训练方法、装置、设备及存储介质。
背景技术
深度图像中的像素点的灰度值可以表示像素点显示的场景距离拍摄设备的远近。因此,深度图像可以用来表示三维场景信息。
在相关技术中,图像深度估计的方法主要有单目深度估计方法和双目深度估计方法。其中,单目深度估计方法是基于一个镜头,双目深度估计方法是基于两个镜头。单目深度估计方法是基于一幅图像来估计它的深度,双目深度估计方法是用两个摄像头成像,因为两个摄像头之间存在一定的距离,所以同一景物通过两个镜头所成的像有一定的差别,即视差,基于视差来估计出图像的深度。
发明内容
本申请实施例提供一种深度估计方法、模型训练方法、装置、设备及存储介质。所述技术方案如下:
一方面,本申请实施例提供一种深度值估计方法,所述方法包括:
获取原始图像;
调用深度估计模型;
通过所述深度估计模型对所述原始图像进行深度值估计,得到所述原始图像的估计深度值集合,所述估计深度值集合包括至少一个估计深度值;
其中,所述深度估计模型的损失函数包括深度损失函数和/或梯度损失函数,所述深度损失函数用于表征基于所述深度估计模型输出的估计深度值和真实深度值之间的差异程度,所述梯度损失函数用于表征估计深度值的梯度和真实深度值的梯度之间的差异程度,所述估计深度值的梯度基于所述估计深度值和步长确定,所述真实深度值的梯度基于所述真实深度值和所述步长确定。
另一方面,本申请实施例提供一种模型训练方法,所述方法包括:
获取深度估计模型的训练数据,所述训练数据包括至少一个训练样本,所述训练样本包括训练图像和所述训练图像的标准深度值集合,所述标准深度值集合包括至少一个标准深度值;
通过所述深度估计模型对所述训练图像进行深度值估计,得到所述训练图像的预测深度值集合,所述预测深度值集合包括至少一个预测深度值;
基于所述训练图像的标准深度值集合和所述训练图像的预测深度值集合,确定损失函数的值;
基于所述损失函数的值对所述深度估计模型进行训练,得到完成训练的深度估计模型;
其中,所述损失函数包括深度损失函数和/或梯度损失函数,所述深度损失函数用于表征基于所述深度估计模型输出的预测深度值和标准深度值之间的差异程度,所述梯度损失函数用于表征预测深度值的梯度和标准深度值的梯度之间的差异程度,所述预测深度值的梯度基于所述预测深度值和步长确定,所述标准深度值的梯度基于所述标准深度值和所述步长确定。
另一方面,本申请实施例提供一种深度值估计装置,所述装置包括:
图像获取模块,用于获取原始图像;
模型调用模块,用于调用深度估计模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110396926.7/2.html,转载请声明来源钻瓜专利网。





