[发明专利]由单张图像联合估计场景深度与语义的方法有效

专利信息
申请号: 201910303361.6 申请日: 2019-04-15
公开(公告)号: CN110120049B 公开(公告)日: 2023-06-30
发明(设计)人: 杨敬钰;徐吉;李坤;岳焕景 申请(专利权)人: 天津大学
主分类号: G06T7/11 分类号: G06T7/11;G06V10/80;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘国威
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 单张 图像 联合 估计 场景 深度 语义 方法
【权利要求书】:

1.一种由单张图像联合估计场景深度与语义的方法,其特征是,步骤如下:

1)利用任何带有单目摄像头的设备进行拍照,获取得到的彩色图像作为网络的输入;

2)迭代网络:将一张彩色图像输入多任务的深度卷积网络构成的对于深度估计和语义分割迭代联合优化的框架,估计出其深度和语义信息,深度信息用来重建三维场景,语义信息能够实现场景的理解;其中,迭代网络是一个多任务的深度卷积网络,包含两个部分:深度估计子网络和语义分割子网络,具体地:

1)深度估计子网络:包括彩色图支路和语义支路,彩色图支路是由一条主干的编解码网络和一条使结果精细化的网络组成,精细化的网络由几个连续条件随机场模块组成,用来提取主干网络中不同尺度的信息,也就是解码出来的不同尺度的信息;语义分割子网络的输出处理结果到语义支路,语义支路是由编解码网络组成,最后,两路信息通过组合用条件随机场模块组合起来,得到最后的深度估计结果;

2)语义估计子网络:包括彩色图支路和深度支路,先对来自深度估计子网络输出的深度图进行质心编码,然后输入到深度支路,彩色图的支路由空洞卷积和多孔空间金字塔池化组成,深度支路由全卷积构成,最终通过长短期记忆网络进行融合;

3)联合优化:对于每一个子网络单独训练,每一个子网络的每一条支路先分别训练,然后组合起来,微调,取深度子网络中彩色图的支路在融合前的特征作为初始化的深度,同理,也取出语义作为初始化,然后将获得的深度和彩色图送到网络中进行迭代。

2.如权利要求1所述的由单张图像联合估计场景深度与语义的方法,其特征是,联合优化具体步骤如下:对于深度估计网络的训练,首先,先单独训练彩色图输入的那一条支路,等到在验证集上的结果不再下降之后,再加入语义分割图输入的那一条支路,联合训练,由于输入彩色图的那一条支路已经训练过了,所以在彩色图输入支路上进行微调即可,主要训练输入语义的那一条支路,到在验证集上的结果基本不再下降之后,训练停止;对于训练语义分割的网络,首先对输入彩色图像的支路进行训练,饱和之后,加入输入深度图的那一条支路,联合训练;要使迭代网络运行起来,需要一个初始化的深度或者语义,具体取深度子网络中彩色图的支路在融合前的特征作为初始化的深度,同理,也取出语义作为初始化;迭代的具体过程是,获得了一个初始化的语义,要想进行迭代就通过输入彩色图和这个获得的语义到深度估计子网络中,学习得到深度图,再将这个深度图和彩色图输入到语义估计子网络中,学习语义分割图,如此进行迭代。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910303361.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top