[发明专利]一种基于深度学习的三维重建方法有效
申请号: | 201910179121.X | 申请日: | 2019-03-11 |
公开(公告)号: | CN109993825B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 孔德慧;刘彩霞;王少帆;李敬华;王立春 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T17/00 | 分类号: | G06T17/00;G06N3/0475;G06N3/094;G06N3/0464;G06N3/0455 |
代理公司: | 北京市中闻律师事务所 11388 | 代理人: | 冯梦洪 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 三维重建 方法 | ||
1.一种基于深度学习的三维重建方法,其特征在于:该方法包括以下步骤:
(1)将输入图像被约束的潜在向量重建出目标完整三维形状,学习部分和完整三维形状之间的映射,然后实现单幅深度图像的三维重建;
(2)学习三维真实对象与重建对象之间的中间特征表示,从而获得目标潜在变量;
(3)利用极限学习机将步骤(1)中预测的体素浮动值变换为二进制值,完成高精度重建;
所述步骤(1)包括以下分步骤:
(1.1)三维GAN重建和判别约束的实现;
(1.2)潜在特征一致性约束的实现;
(1.3)深度投影一致性约束的实现;
所述步骤(1.1)采用改进的Wasserstein GAN进行训练;
对于生成器,目标函数Lg通过公式(1)获得:
Lg=η(-βytlog(yp)-(1-β)(1-yt)log(1-yp))-(1-η)Ε[D(yp|x)] (1)
其中,x为深度图像转化后的三维体素值,yp是网络生成的三维对象值,实验中β被设置为0.85,η被设置为5;
对于判别器,通过缩小真实对和生成对之间的Wasserstein距离来训练,其目标函数Ld为公式(2):
其中,λ用来优化梯度惩罚和原始目标之间的权衡;
所述步骤(1.2)利用学习到的三维真实对象的潜在特征向量信息约束输入图像的潜在向量,以指导模型生成目标三维形状数据,使缺失部分能够准确预测,其损失函数Ll为公式(3):
Ll=Ε(Zt)-Ε(Zp) (3)
其中,Zt是三维真实对象学习到的潜在向量,Zp是单幅深度图像学习到的潜在向量,Ε(·)表示期望;
所述步骤(1.3)在预测的三维形状和输入的深度图像之间进行了投影约束,投影后的深度值与输入的深度值保持一致,提高输入信息的保真度,以便模型对生成的三维形状进行微调,其损失函数Lproject为公式(4):
其中,yp(x,y,z)表示预测的三维形状yp在位置(x,y,z)处的值,yp(x,y,z)∈{0,1},dx,y是输入图像x在位置(x,y)处的深度值。
2.根据权利要求1所述的基于深度学习的三维重建方法,其特征在于:所述步骤(2)采用一个具有跳跃连接的三维深度卷积AE,编码器的特征层会被相应地连接到解码器。
3.根据权利要求2所述的基于深度学习的三维重建方法,其特征在于:所述步骤(2)中网络结构包括编码器和解码器:编码器有四个三维卷积层,每个卷积层有一组4×4×4的滤波器,滑动步幅为1×1×1,接着是一个ReLU激活函数和一个最大池化层;然后有两个完全连接层,其中第二个完全连接层是学习到的潜在向量;解码器由四个对称的反卷积层组成,除最后一层使用Sigmoid激活函数外,其它反卷积层都使用ReLU激活函数,整个计算流程为:643(1)→323(64)→163(128)→83(256)→43(512)→32768→5000→32768→43(512)→83(256)→163(128)→323(64)→643(1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910179121.X/1.html,转载请声明来源钻瓜专利网。