[发明专利]多视图三维重建方法及装置在审
申请号: | 202210325207.0 | 申请日: | 2022-03-30 |
公开(公告)号: | CN115330929A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 庞大为;王江安 | 申请(专利权)人: | 土豆数据科技集团有限公司 |
主分类号: | G06T17/00 | 分类号: | G06T17/00;G06N3/04;G06N3/08 |
代理公司: | 西安毅联专利代理有限公司 61225 | 代理人: | 张为攀 |
地址: | 710000 陕西省西安市高新*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视图 三维重建 方法 装置 | ||
1.一种多视图三维重建方法,其特征在于,包括:
使用多层普通卷积处理多张输入图像,获得每张所述输入图像的多张不同尺度的第一特征图;多张所述输入图像中包括一张参考图像,其余为源图像;
使用多个不共享参数的可变形卷积处理多张不同尺度的所述第一特征图,并双线性插值后获得每张所述输入图像的多张不同尺度的第二特征图;其中,所述可变形卷积定义如下:
f(p)表示像素p的特征值,wk和pk分别表示在所述普通卷积中定义的卷积核参数和固定偏移量,Δpk和Δmk分别表示所述可变形卷积经过学习产生的偏移量和权重;
对每张所述输入图像的多张所述第二特征图进行拼接,获得每张所述输入图像的输出特征图;
根据每张所述输入图像的所述输出特征图和相机参数构建代价体;
正则化所述代价体获得概率体;
根据所述概率体确定所述参考图像的初始深度图;
优化所述初始深度图,获得深度优化图;
融合多张所述深度优化图生成稠密点云。
2.根据权利要求1所述的多视图三维重建方法,其特征在于,所述正则化所述代价体得到概率体包括:
使用分层式递归卷积网络模块对所述代价体正则化,获得正则化后的多张代价图;所述分层式递归卷积网络模块包括多个依次排列的LSTMConvcell,以及设置于两个所述LSTMConvcell之间的池化层和反卷积层;
根据多张所述代价图生成相应的所述概率体。
3.根据权利要求1所述的多视图三维重建方法,其特征在于,所述根据所述概率体确定参考图像的初始深度图包括:
沿所述概率体的深度方向,以深度期望值作为每个像素的深度估计值来确定所述参考图像的初始深度图。
4.根据权利要求1所述的多视图三维重建方法,其特征在于,所述优化所述初始深度图包括:
通过所述初始深度图,将所述参考图像上的像素点投影到每张所述源图像的对应位置,计算所述参考图像的所述输出特征图的取值和所述源图像的所述输出特征图的取值的差异值;
使用高斯牛顿法最小化所述差异值;
计算残差,所述残差的计算公式如下:
ri(p)=Fi(p′i)-F0(p);
其中,Fi(p′i)为所述源图像的所述输出特征图的取值,F0(p)为所述参考图像的所述输出特征图的取值;
计算每个所述残差对所述初始深度图的一阶导数Ji(p),并根据以下公式确定当前深度的增量δ:
δ=-(JTJ)-1JTr;
其中,J是矩阵{Ji(p)}的叠加,r是残差向量{ri(p)}的叠加;
将所述当前深度的增量与所述初始深度图的取值相加得到所述优化深度图。
5.根据权利要求1所述的多视图三维重建方法,其特征在于,所述融合多张所述深度优化图生成稠密点云包括:
将全部所述深度优化图的动态匹配一致性进行融合,获得全局动态多视图几何一致性;所述动态匹配一致性定义如下:
所述全局动态多视图几何一致性定义如下:
其中,εp和εd分别表示像素重投影误差和深度重投影误差,λ表示影响两个不同的重投影误差的系数;
使用预设过滤系数过滤异常值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于土豆数据科技集团有限公司,未经土豆数据科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210325207.0/1.html,转载请声明来源钻瓜专利网。