[发明专利]一种基于任意视角图片的三维结构化模型重建的方法在审

专利信息
申请号: 202110378246.2 申请日: 2021-04-08
公开(公告)号: CN113077554A 公开(公告)日: 2021-07-06
发明(设计)人: 毛爱华;代沧澜 申请(专利权)人: 华南理工大学
主分类号: G06T17/20 分类号: G06T17/20;G06T19/20;G06N3/04
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍;江裕强
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 任意 视角 图片 三维 结构 模型 重建 方法
【权利要求书】:

1.一种基于任意视角图片的三维结构化模型重建的方法,其特征在于,包括以下步骤:

步骤1、采集图片,构成训练数据集;

步骤2、对图片的物体部件进行分割,获取每个部件的包围盒;

步骤3、构建深度图提取网络,从图像中提取对应的深度图像;

步骤4、构建结构恢复网络,解码出物体的结构表示;

步骤5、构建并训练深度三维网格变形网络,将包围盒变形成三维模型。

2.根据权利要求1所述的一种基于任意视角图片的三维结构化模型重建的方法,其特征在于,所述训练数据集的图片包括物体的三维网格和与之对应的RGB图片和深度图片。

3.根据权利要求2所述的一种基于任意视角图片的三维结构化模型重建的方法,其特征在于,所述包围盒的参数包括:中心点的坐标、包围盒的长宽高以及长和宽的单位方向向量;并对每个分割好的部件进行采样。

4.根据权利要求3所述的一种基于任意视角图片的三维结构化模型重建的方法,其特征在于,所述深度图提取网络包括两个尺度网络,第一个尺度网络用于捕获整个图像的信息,架构为RestNet18,并连接两个全连接层;第二个尺度网络对输入的图像先进行卷积和池化,再进行连续卷积;

所述深度图提取网络搭建并训练RGB图片到深度图的映射,该深度图提取网络的输入为二维图片,输出为该图片对应的深度图,训练完成后保存该网络模型参数;

所述深度图提取网络训练时,目标函数最小化预测出来的深度值和真实值的差:

其中,Predicti,j为预测的深度图中的索引为(i,j)的值;GTi,j为真实的深度图中的索引为(i,j)的值。

5.根据权利要求4所述的一种基于任意视角图片的三维结构化模型重建的方法,其特征在于,所述结构恢复网络包括两个部分,第一个部分是融合深度图的特征和RGB图片的特征,将提取得到的特征集成到潜在向量中,并递归的将该潜在向量解码到物体各个部件的包围盒中;第二部分包括递归神经网络(RvNN),该RvNN递归地将潜在向量解码为不同的特征层次,直到到达叶节点,叶节点进一步解码为包围盒的参数。

6.根据权利要求5所述的一种基于任意视角图片的三维结构化模型重建的方法,其特征在于,所述结构恢复网络的损失函数如下:

Lmask=CHS(T(Bi)U,T(Bj)U)

其中,T(Bi)是单位正方体经过旋转变换成包围盒Bi的旋转矩阵;U为对单位正方体进行采样的点;CHS是计算两簇点的最小距离;T(Bj)是单位正方体经过旋转变换成包围盒Bj的旋转矩阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110378246.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top