[发明专利]一种基于深度学习的三维重建方法有效
申请号: | 201910179121.X | 申请日: | 2019-03-11 |
公开(公告)号: | CN109993825B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 孔德慧;刘彩霞;王少帆;李敬华;王立春 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T17/00 | 分类号: | G06T17/00;G06N3/0475;G06N3/094;G06N3/0464;G06N3/0455 |
代理公司: | 北京市中闻律师事务所 11388 | 代理人: | 冯梦洪 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 三维重建 方法 | ||
公开一种基于深度学习的三维重建方法,该方法包括:(1)将输入图像被约束的潜在向量重建出目标完整三维形状,学习部分和完整三维形状之间的映射,然后实现单幅深度图像的三维重建;(2)学习三维真实对象与重建对象之间的中间特征表示,从而获得步骤(1)中的目标潜在变量;(3)利用极限学习机将步骤(1)中预测的体素浮动值变换为二进制值,完成高精度重建。
技术领域
本发明涉及计算机视觉和三维重建的技术领域,尤其涉及一种基于深度学习的三维重建方法。
背景技术
基于视觉的三维重建是从视觉传感器获取的图像恢复对象的三维信息(形状,纹理等)的计算过程和技术。精确的三维重建对于许多应用至关重要,如文物修复、机器人抓取和自动避障等。目前传统的三维重建方法存在一定局限性,包括:需要精确校准的相机和高质量的视觉成像元件;重建过程包含图像预处理、点云配准、数据融合等多个步骤,易导致误差累积,降低重建精度;且难以重建出感知对象被遮挡或发生信息丢失部分的形状。这些缺陷导致传统方法的重建结果质量较低,使得它们在实践中不能被广泛应用,因此,基于视觉的高精度三维重建问题具有很大的挑战性。
近年来,深度学习的快速发展和大量三维几何模型数据库的公布,为高精度三维重建方法带来了新思路。目前较为多见的基于深度学习的方法利用深度生成模型,如生成对抗网络(Generative Adversarial Networks,GAN),自编码器(AutoEncoder,AE)和变分自动编码器(Variational AutoEncoder,VAE),从单视角图像进行三维重建。这些方法的主体框架包括编码和解码两个阶段,在编码阶段将输入数据编码为潜在特征,在解码阶段将此特征解码生成完整三维形状。基于GAN的重建方法采用随机噪声作为输入,通过判别器与生成器的对抗来保证重建精度,但由于随机噪声不能反映重建对象的先验信息,导致重建结果不具有特异性;而基于AE的重建方法仅将生成器的重建损失极小视为优化目标而没有考虑判别器的对抗性损失,使得重建结果受限于已知的输入信息而难以扩展出未知部分。自然地,将AE类方法保持的先验信息和GAN类方法具有的判别性相结合,即将AE的解码器设置为GAN的生成器,可以同时克服以上两类方法的缺陷。然而,这种基于GAN和AE融合的方法虽然改进了重建精度,但是不能完全恢复被遮挡和缺失的区域,并且会产生噪声,这在模型的跨类别重建过程中更为明显。
发明内容
为克服现有技术的缺陷,本发明要解决的技术问题是提供一种基于深度学习的三维重建方法,其不需要人工设计复杂的特征算法,能够避免复杂的相机校准及精细的流程设计,并具备通过学习“所见”拓展“所知”,重建“所未知”的能力,可以弥补传统重建方法“所知即所见”的内在缺陷,使其不仅能够将输入的深度信息可以高度保真,还能够准确预测对象的缺失部分,从而实现高精度三维重建。
本发明的技术方案是:这种基于深度学习的三维重建方法,该方法包括以下步骤:
(1)将输入图像被约束的潜在向量重建出目标完整三维形状,学习部分和完整三维形状之间的映射,然后实现单幅深度图像的三维重建;
(2)学习三维真实对象与重建对象之间的中间特征表示,从而获得步骤(1)中的目标潜在变量;
(3)利用极限学习机将步骤(1)中预测的体素浮动值变换为二进制值,完成高精度重建。
本发明利用深度神经网络进行了高性能的特征提取、避免了人工设计的多环节误差积累;通过学习三维形状的潜在信息约束了输入图像,使缺失部分能够准确预测;将预测的三维形状进行了深度投影一致性约束,使输入的信息可以高度保真;利用空间局部模式分类器将预测的三维形状进行了二值化重建,实现了高精度三维重建;因此模型不需要人工设计复杂的特征算法,也避免了复杂的相机校准及精细的流程设计,并具备了通过学习“所见”拓展“所知”,重建“所未知”的能力,弥补了传统重建方法“所知即所见”的内在缺陷,实验表明,基于三维GAN-LFPC模型的重建结果不仅能够重建对象未知的部分,同时还能避免噪声的引入,其定性及定量评价指标均优于目前主流重建算法。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910179121.X/2.html,转载请声明来源钻瓜专利网。