[发明专利]一种基于条件生成对抗网络的单目图像深度估计方法在审
| 申请号: | 201810193746.7 | 申请日: | 2018-03-09 |
| 公开(公告)号: | CN108564611A | 公开(公告)日: | 2018-09-21 |
| 发明(设计)人: | 侯春萍;管岱;杨阳;郎玥;章衡光 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06T7/50 | 分类号: | G06T7/50 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 构建 对抗 网络 解码器 单目图像 基于条件 深度估计 编码器 生成器 生成式 预处理 解码器结构 连接结构 深度图像 输出特征 输出图像 损失函数 网络结构 细节特征 细节信息 反卷积 判别器 输出层 输入层 数据集 低层 卷积 维度 映射 对称 跳跃 测试 共享 高层 | ||
1.一种基于条件生成对抗网络的单目图像深度估计方法,包括步骤如下:
(1)对数据集进行预处理:将数据集中保存的深度信息的矩阵统一转化为深度图像格式,用于网络的训练、生成深度图的可视化及估计结果的评估,并且将彩色图像与对应的深度图像组成图像对,用于网络的训练;
(2)构建生成式对抗网络中的生成器:利用编码器-解码器结构,构建由卷积层-反卷积层组合的生成器网络结构,并在此基础上构建跳跃连接结构,将编码器每层的输出特征图映射到对称解码器的输入中,通过通道维度连接起来,以增加解码器的细节信息;在输入层和输出层之间共享低层的信息,使得高层输出图像带有低级的细节特征,提升生成深度图像的质量;
(3)构建生成式对抗网络中的判别器:采用卷积层-激活函数层-批量归一化层BatchNorm作为判别器网络的组成单元,多层堆叠成最终的判别网络,采用分块判别器的结构,分别判别生成器生成图像各块的图像是否为真实图像或虚假图像,再将各块的响应取平均值作为判别器的最终输出;
(4)构建生成对抗网络的损失函数:在条件生成对抗网络损失函数的基础上,加入一范数损失函数,使得生成器的任务不仅要求其混淆判别器,还在一范数空间中最小化生成图像与真实标签之间的损失,提升生成图像在低频信息段的质量,并且使用dropout代替条件生成网络通常使用的高斯噪声;
(5)对构建完成的生成对抗网络进行训练和测试:将第一步得到的数据集,每次随机选择一副图像对,首先进行随机裁剪的数据增强,输入到网络中进行训练调整训练参数,选择优化器,对判别器和生成器交替式训练,前向传递计算损失值,反向传递更新网络权重,经过一定的迭代次数之后保存最终生成器网络的权重,将测试集的彩色图像输入进训练好的生成器网络中,得到网络预测出的深度图像。
2.根据权利要求1所述的方法,其特征在于,步骤(5)中交替式训练的方法为:每次随机从训练数据集中选择一对图像作为训练数据,先把真实彩色图像与真实深度图像组成成多通道图像输入到判别器中,作为正样本,将网络输出与正样本标签进行交叉熵损失值计算,采用反向传播算法回传梯度值,更新判别器网络权重;然后将彩色图像输入到生成网络中,得到生成深度图像,再与原彩色图像组合成多通道图像输入到判别网络中,作为负样本,计算交叉熵损失值以及生成深度图像与真实深度图像的一范数损失,统一回传生成网络并更新网络权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810193746.7/1.html,转载请声明来源钻瓜专利网。





