[发明专利]一种基于全卷积神经网络的立体高动态范围成像方法有效
申请号: | 201911044976.8 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110910336B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 陈晔曜;郁梅;蒋刚毅;彭宗举;陈芬 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T7/55;G06N3/04 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 立体 动态 范围 成像 方法 | ||
1.一种基于全卷积神经网络的立体高动态范围成像方法,其特征在于包括以下步骤:
步骤一:构建三个全卷积神经网络,分别为曝光校准网络、空洞填补网络、HDR图像融合网络;
1)曝光校准网络的构建过程为:
曝光校准网络包括用于在图像空间压缩和编码图像的第一编码器、用于进一步提取图像的高水平特征并防止梯度弥散和梯度爆炸问题的第一残差块组、用于重建目标图像的第一解码器三部分;
第一编码器由依次连接的第一卷积层、第二卷积层和第三卷积层组成,第一卷积层的输入端接收一幅三通道的宽度为W且高度为H的第一彩色图像,第一卷积层的输出端输出32幅宽度为W且高度为H的特征图,将输出的所有特征图构成的集合记为FcE,1;第二卷积层的输入端接收FcE,1中的所有特征图,第二卷积层的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FcE,2;第三卷积层的输入端接收FcE,2中的所有特征图,第三卷积层的输出端输出128幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FcE,3;其中,第一卷积层的卷积核的尺寸为7×7、卷积步长为1、输入通道数为3、输出通道数为32,第二卷积层的卷积核的尺寸为3×3、卷积步长为2、输入通道数为32、输出通道数为64,第三卷积层的卷积核的尺寸为3×3、卷积步长为2、输入通道数为64、输出通道数为128,第一卷积层、第二卷积层和第三卷积层的激活函数均为ReLU;
第一残差块组由依次连接的第一残差块、第二残差块、第三残差块和第四残差块组成,第一残差块的输入端接收FcE,3中的所有特征图,第一残差块的输出端输出128幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FcR,1;第二残差块的输入端接收FcR,1中的所有特征图,第二残差块的输出端输出128幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FcR,2;第三残差块的输入端接收FcR,2中的所有特征图,第三残差块的输出端输出128幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FcR,3;第四残差块的输入端接收FcR,3中的所有特征图,第四残差块的输出端输出128幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FcR,4;
第一解码器由依次连接的第一反卷积层、第二反卷积层和第四卷积层组成,第一反卷积层的输入端接收FcR,4中的所有特征图,第一反卷积层的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FcD,1;第二反卷积层的输入端接收FcD,1中的所有特征图,第二反卷积层的输出端输出32幅宽度为W且高度为H的特征图,将输出的所有特征图构成的集合记为FcD,2;第四卷积层的输入端接收FcD,2中的所有特征图,第四卷积层的输出端输出一幅三通道的宽度为W且高度为H的重建彩色图像;其中,第一反卷积层的卷积核的尺寸为3×3、反卷积步长为2、输入通道数为128、输出通道数为64,第二反卷积层的卷积核的尺寸为3×3、反卷积步长为2、输入通道数为64、输出通道数为32,第四卷积层的卷积核的尺寸为1×1、卷积步长为1、输入通道数为32、输出通道数为3,第一反卷积层、第二反卷积层的激活函数均为ReLU,第四卷积层的激活函数为Tanh;
2)空洞填补网络的构建过程为:
空洞填补网络包括用于提取图像的曝光信息的额外曝光信息编码器、用于提取图像的邻域信息的邻域信息编码器、用于整合额外曝光信息编码器和邻域信息编码器的输出并重建目标图像的第二解码器三部分;
额外曝光信息编码器由依次连接的第七卷积层、第八卷积层和第九卷积层组成,第七卷积层的输入端接收一幅三通道的宽度为W且高度为H的第二彩色图像,第七卷积层的输出端输出32幅宽度为W且高度为H的特征图,将输出的所有特征图构成的集合记为FhE,1;第八卷积层的输入端接收FhE,1中的所有特征图,第八卷积层的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhE,2;第九卷积层的输入端接收FhE,2中的所有特征图,第九卷积层的输出端输出128幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhE,3;其中,第七卷积层的卷积核的尺寸为7×7、卷积步长为1、输入通道数为3、输出通道数为32,第八卷积层的卷积核的尺寸为3×3、卷积步长为2、输入通道数为32、输出通道数为64,第九卷积层的卷积核的尺寸为3×3、卷积步长为2、输入通道数为64、输出通道数为128,第七卷积层、第八卷积层和第九卷积层的激活函数均为ReLU;
邻域信息编码器由依次连接的第十卷积层、第十一卷积层和第十二卷积层组成,第十卷积层的输入端接收一幅三通道的宽度为W且高度为H的第三彩色图像,第十卷积层的输出端输出32幅宽度为W且高度为H的特征图,将输出的所有特征图构成的集合记为FhN,1;第十一卷积层的输入端接收FhN,1中的所有特征图,第十一卷积层的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhN,2;第十二卷积层的输入端接收FhN,2中的所有特征图,第十二卷积层的输出端输出128幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhN,3;其中,第十卷积层的卷积核的尺寸为7×7、卷积步长为1、输入通道数为3、输出通道数为32,第十一卷积层的卷积核的尺寸为3×3、卷积步长为2、输入通道数为32、输出通道数为64,第十二卷积层的卷积核的尺寸为3×3、卷积步长为2、输入通道数为64、输出通道数为128,第十卷积层、第十一卷积层和第十二卷积层的激活函数均为ReLU;
第二解码器由依次连接的第一级联层、第三反卷积层、第四反卷积层和第十三卷积层组成,第一级联层的输入端接收FhE,3中的所有特征图和FhN,3中的所有特征图,第一级联层对FhE,3中的所有特征图和FhN,3中的所有特征图在特征图数目维度进行级联,第一级联层的输出端输出256幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhD,1;第三反卷积层的输入端接收FhD,1中的所有特征图,第三反卷积层的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhD,2;第四反卷积层的输入端接收FhD,2中的所有特征图,第四反卷积层的输出端输出32幅宽度为W且高度为H的特征图,将输出的所有特征图构成的集合记为FhD,3;第十三卷积层的输入端接收FhD,3中的所有特征图,第十三卷积层的输出端输出一幅三通道的宽度为W且高度为H的重建彩色图像;其中,第三反卷积层的卷积核的尺寸为3×3、反卷积步长为2、输入通道数为256、输出通道数为64,第四反卷积层的卷积核的尺寸为3×3、反卷积步长为2、输入通道数为64、输出通道数为32,第十三卷积层的卷积核的尺寸为1×1、卷积步长为1、输入通道数为32、输出通道数为3,第三反卷积层、第四反卷积层的激活函数均为ReLU,第十三卷积层的激活函数为Tanh;
3)HDR图像融合网络的构建过程为:
HDR图像融合网络包括用于提取图像的融合特征的第二编码器、用于进一步提取图像的高水平融合特征并防止梯度弥散和梯度爆炸问题的第二残差块组、用于重建目标图像的第三解码器三部分;
第二编码器由依次连接的第二级联层、第十四卷积层和第十五卷积层组成,第二级联层的输入端接收四幅三通道的宽度为W且高度为H的彩色图像,分别为第四彩色图像、第五彩色图像、第六彩色图像、第七彩色图像,第二级联层对四幅彩色图像在图像数目维度进行级联,第二级联层的输出端输出12幅宽度为W且高度为H的图像,将输出的所有图像构成的集合记为FhdrE,1;第十四卷积层的输入端接收FhdrE,1中的所有图像,第十四卷积层的输出端输出32幅宽度为W且高度为H的特征图,将输出的所有特征图构成的集合记为FhdrE,2;第十五卷积层的输入端接收FhdrE,2中的所有特征图,第十五卷积层的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhdrE,3;其中,第十四卷积层的卷积核的尺寸为7×7、卷积步长为1、输入通道数为12、输出通道数为32,第十五卷积层的卷积核的尺寸为3×3、卷积步长为2、输入通道数为32、输出通道数为64,第十四卷积层、第十五卷积层的激活函数均为ReLU;
第二残差块组由依次连接的第五残差块、第六残差块、第七残差块和第八残差块组成,第五残差块的输入端接收FhdrE,3中的所有特征图,第五残差块的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhdrR,1;第六残差块的输入端接收FhdrR,1中的所有特征图,第六残差块的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhdrR,2;第七残差块的输入端接收FhdrR,2中的所有特征图,第七残差块的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhdrR,3;第八残差块的输入端接收FhdrR,3中的所有特征图,第八残差块的输出端输出64幅宽度为且高度为的特征图,将输出的所有特征图构成的集合记为FhdrR,4;
第三解码器由依次连接的第五反卷积层和第十六卷积层组成,第五反卷积层的输入端接收FhdrR,4中的所有特征图,第五反卷积层的输出端输出32幅宽度为W且高度为H的特征图,将输出的所有特征图构成的集合记为FhdrD,1;第十六卷积层的输入端接收FhdrD,1中的所有特征图,第十六卷积层的输出端输出一幅三通道的宽度为W且高度为H的重建彩色图像;其中,第五反卷积层的卷积核的尺寸为3×3、反卷积步长为2、输入通道数为64、输出通道数为32,第十六卷积层的卷积核的尺寸为1×1、卷积步长为1、输入通道数为32、输出通道数为3,第五反卷积层的激活函数均为ReLU,第十六卷积层的激活函数为Sigmoid;
步骤二:选取Num组左视点多曝光图像和对应的Num幅高质量参考左视点高动态范围图像,以及对应于左视点多曝光图像的Num组右视点多曝光图像和对应的Num幅高质量参考右视点高动态范围图像,每组左视点多曝光图像包括左视点欠曝光图像、左视点过曝光图像和左视点正常曝光图像,每组右视点多曝光图像包括右视点欠曝光图像、右视点过曝光图像和右视点正常曝光图像;其中,Num>1,上述各幅图像的宽度为W且高度为H;
步骤三:将每幅左视点正常曝光图像作为标签图像,并将对应的左视点欠曝光图像作为第一彩色图像输入到曝光校准网络中进行训练,得到每幅左视点欠曝光图像对应的重建左视点正常曝光图像;然后将每幅右视点正常曝光图像作为标签图像,并将对应的右视点过曝光图像作为第一彩色图像输入到曝光校准网络中进行训练,得到每幅右视点过曝光图像对应的重建右视点正常曝光图像;训练结束后得到曝光校准网络中的各卷积核和偏置项的最佳参数,即得到训练有素的曝光校准网络模型;
步骤四:对每幅重建左视点正常曝光图像和对应的重建右视点正常曝光图像进行立体匹配,得到每幅重建左视点正常曝光图像的左视点视差图、每幅重建右视点正常曝光图像的右视点视差图;然后根据每幅重建左视点正常曝光图像的左视点视差图,对对应的左视点欠曝光图像进行前向绘制,得到对应的绘制右视点欠曝光图像;并根据每幅重建右视点正常曝光图像的右视点视差图,对对应的右视点过曝光图像进行前向绘制,得到对应的绘制左视点过曝光图像;
步骤五:将每幅左视点过曝光图像作为标签图像,并将对应的左视点欠曝光图像作为第二彩色图像、将对应的绘制左视点过曝光图像作为第三彩色图像输入到空洞填补网络中进行训练,得到对应的重建左视点过曝光图像;然后将每幅右视点欠曝光图像作为标签图像,并将对应的右视点过曝光图像作为第二彩色图像、将对应的绘制右视点欠曝光图像作为第三彩色图像输入到空洞填补网络中进行训练,得到对应的重建右视点欠曝光图像;训练结束后得到空洞填补网络中的各卷积核和偏置项的最佳参数,即得到训练有素的空洞填补网络模型;
步骤六:基于相机响应函数和曝光值,将每幅左视点欠曝光图像转换到辐照域,将得到的图像作为左视点对应的第一初始高动态范围图像;同样,基于相机响应函数和曝光值,将每幅左视点过曝光图像转换到辐照域,将得到的图像作为左视点对应的第二初始高动态范围图像;
或基于相机响应函数和曝光值,将每幅右视点欠曝光图像转换到辐照域,将得到的图像作为右视点对应的第一初始高动态范围图像;同样,基于相机响应函数和曝光值,将每幅右视点过曝光图像转换到辐照域,将得到的图像作为右视点对应的第二初始高动态范围图像;
步骤七:将每幅高质量参考左视点高动态范围图像作为标签图像,并将左视点对应的第一初始高动态范围图像、左视点对应的第二初始高动态范围图像、左视点欠曝光图像、左视点过曝光图像对应作为第四彩色图像、第五彩色图像、第六彩色图像、第七彩色图像输入到HDR图像融合网络中进行训练,得到对应的重建高动态范围图像;训练结束后得到HDR图像融合网络中的各卷积核和偏置项的最佳参数,即得到训练有素的HDR图像融合网络模型;
或将每幅高质量参考右视点高动态范围图像作为标签图像,并将右视点对应的第一初始高动态范围图像、右视点对应的第二初始高动态范围图像、右视点欠曝光图像、右视点过曝光图像对应作为第四彩色图像、第五彩色图像、第六彩色图像、第七彩色图像输入到HDR图像融合网络中进行训练,得到对应的重建高动态范围图像;训练结束后得到HDR图像融合网络中的各卷积核和偏置项的最佳参数,即得到训练有素的HDR图像融合网络模型;
步骤八:选取一组具有不同曝光水平的立体图像作为测试图像,将测试图像中的左视点欠曝光图像记为Itest,left_under,将测试图像中的右视点过曝光图像记为Itest,right_over;
步骤九:将Itest,left_under作为第一彩色图像输入到曝光校准网络模型中,测试得到重建左视点正常曝光图像,记为Irec-left_normal;然后将Itest,right_over作为第一彩色图像输入到曝光校准网络模型中,测试得到重建右视点正常曝光图像,记为Irec-right_normal;
步骤十:对Irec-left_normal和Irec-right_normal进行立体匹配,得到Irec-left_normal的左视点视差图、Irec-right_normal的右视点视差图;然后根据Irec-left_normal的左视点视差图,对Itest,left_under进行前向绘制,得到绘制右视点欠曝光图像,记为Iinit-right_under;并根据Irec-right_normal的右视点视差图,对Itest,right_over进行前向绘制,得到绘制左视点过曝光图像,记为Iinit-left_over;
步骤十一:将Itest,left_under作为第二彩色图像、将Iinit-left_over作为第三彩色图像输入到空洞填补网络模型中,测试得到重建左视点过曝光图像,记为Irec-left_over;然后将Itest,right_over作为第二彩色图像、将Iinit-right_under作为第三彩色图像输入到空洞填补网络模型中,测试得到重建右视点欠曝光图像,记为Irec-right_under;
步骤十二:基于相机响应函数和曝光值,将Itest,left_under转换到辐照域,将得到的图像作为左视点对应的第一初始高动态范围图像,记为I1,left_init-hdr;同样,基于相机响应函数和曝光值,将Irec-left_over转换到辐照域,将得到的图像作为左视点对应的第二初始高动态范围图像,记为I2,left_init-hdr;然后将I1,left_init-hdr、I2,left_init-hdr、Itest,left_under、Irec-left_over对应作为第四彩色图像、第五彩色图像、第六彩色图像、第七彩色图像输入到HDR图像融合网络模型中,测试得到左视点对应的重建高动态范围图像,记为Irec-left_hdr;
基于相机响应函数和曝光值,将Irec-right_under转换到辐照域,将得到的图像作为右视点对应的第一初始高动态范围图像,记为I1,right_init-hdr;同样,基于相机响应函数和曝光值,将Itest,right_over转换到辐照域,将得到的图像作为右视点对应的第二初始高动态范围图像,记为I2,right_init-hdr;然后将I1,right_init-hdr、I2,right_init-hdr、Irec-right_under、Itest,right_over对应作为第四彩色图像、第五彩色图像、第六彩色图像、第七彩色图像输入到HDR图像融合网络模型中,测试得到右视点对应的重建高动态范围图像,记为Irec-right_hdr;
将Irec-left_hdr和Irec-right_hdr组成立体高动态范围图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911044976.8/1.html,转载请声明来源钻瓜专利网。