[发明专利]模型训练及深度估计方法、装置、存储介质及电子设备在审
申请号: | 202210070815.1 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114494381A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 舒畅;任海兵;王明晖;胡琦;申浩;夏华夏 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06T7/50 | 分类号: | G06T7/50 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 邓超 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 深度 估计 方法 装置 存储 介质 电子设备 | ||
本说明书公开了模型训练及深度估计方法、装置、存储介质及电子设备。在样本图像中为每个像素点选取至少两对参照点对,其中每对参照点对中的参照点与该像素点位于同一直线上,然后根据深度估计模型输出的深度图将像素点及其参照点映射至三维空间内并得到三维坐标,从而得到以参照点对中的参照点为起点和终点的至少两个参照向量,以根据参照向量确定出像素点的预测法向量,并根据预测法向量与该像素点对应的标注法向量之间的差异构建损失进行训练,以提高深度估计模型输出的深度图的准确性。
技术领域
本说明书涉及计算机视觉领域,尤其涉及模型训练及深度估计方法、装置、存储介质及电子设备。
背景技术
图像的深度估计在计算机视觉领域中是一种应用广泛的技术,例如,利用包含深度信息的图像,可以识别出图像中表达某一语义的对象的三维检测框。
目前,常使用机器学习模型来估计图像的深度,即,将图像输入至训练后的深度估计模型,可得到深度估计模型输出的图像对应的深度图。
为了提高深度估计模型所输出的深度图的准确性,对深度估计模型进行训练变得尤其重要。
发明内容
本说明书提供一种模型训练及深度估计方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种模型训练方法,包括:
确定样本图像;
将所述样本图像输入待训练的深度估计模型,并得到所述深度估计模型所输出的所述样本图像对应的深度图;
针对所述样本图像中的每个像素点,将该像素点作为目标像素点,确定所述目标像素点对应的至少两个参照点对,其中,针对每个参照点对,在样本图像上经过该参照点对中的两个参照点的直线经过所述目标像素点;
根据所述样本图像对应的深度图,确定所述目标像素点和各参照点的三维坐标,针对每个参照点对,根据该参照点对中两个参照点的三维坐标,确定以该参照点对中的参照点为起点和终点的参照向量,作为所述目标像素点对应的参照向量;
基于所述目标像素点对应的各参照向量,得到所述目标像素点在三维空间中的预测法向量;
获取预先确定的各像素点在三维空间中的标注法向量,以各像素点的预测法向量和标注法向量之间的差异最小为目标,调整所述深度估计模型中的参数。
可选地,确定所述目标像素点对应的至少两个参照点对,具体包括:
确定经过所述目标像素点的至少两个直线;
针对所确定出的每个直线,确定出位于该直线上并在沿该直线的不同方向上相对于所述目标像素点的距离为指定距离的两个像素点,作为该目标像素点对应的参照点对,其中,所述指定距离不小于预先设定的距离阈值。
可选地,经过所述目标像素点的各直线中,至少包括一个直线沿所述样本图像所在的图像坐标系的横轴方向,并至少包括一个直线沿所述样本图像所在的图像坐标系的纵轴方向;
确定出位于该直线上并在沿该直线的不同方向上相对于所述目标像素点的距离为指定距离的两个像素点,具体包括:
获取预先设定的间隔像素数量;
确定出位于该直线上并在沿该直线的不同方向上相对于所述目标像素点的距离为指定距离的两个像素点,其中,针对每个像素点,该像素点与目标像素点之间的指定距离为像素点的单位长度与所述间隔像素数量的乘积。
可选地,确定以该参照点对中的参照点为起点和终点的参照向量,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210070815.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种教学用便于调整方向的投影仪
- 下一篇:一种桥梁受力监测系统及其使用方法