[发明专利]视频高动态范围反色调映射模型构建、映射方法及装置有效
申请号: | 201910840429.4 | 申请日: | 2019-09-06 |
公开(公告)号: | CN110717868B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 宋利;徐宇澄;解蓉;张文军 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/90;G06N3/04;G06N3/08 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 动态 范围 色调 映射 模型 构建 方法 装置 | ||
1.一种视频高动态范围反色调映射模型构建方法,其特征在于,包括:
将原始高动态范围视频剪切为多个高动态范围视频,将所述高动态范围视频转化为标准动态范围视频,所述标准动态范围视频与所述高动态范围视频组成有监督的数据集,作为后续的训练数据集;
建立基于三维卷积神经网络和跳跃式连接的视频生成网络;
对所述视频生成网络建立由空间特征、时域特征、本征特征和感知特征综合的目标损失函数,采用所述训练数据集不断训练优化,得到能完成反色调映射的网络模型。
2.根据权利要求1所述的视频高动态范围反色调映射模型构建方法,其特征在于:所述有监督的数据集,建立时:
将所述原始高动态范围视频按场景截取为数个短的所述高动态范围视频;
将所述高动态范围视频分块切割成低分辨率的短视频,将高动态范围的所述短视频映射为标准动态范围视频,形成有监督训练对。
3.根据权利要求2所述的视频高动态范围反色调映射模型构建方法,其特征在于:将高动态范围的所述短视频映射为标准动态范围视频,其中:使用Reinhard色调映射算法实现。
4.根据权利要求1所述的视频高动态范围反色调映射模型构建方法,其特征在于:所述数据集包含多组标准动态范围和高动态范围对应的视频用于训练所述视频生成网络,在训练前,采用进行逆伽玛映射预处理输入的标准动态范围视频,形成线性亮度的标准动态范围视频后再输入所述视频生成网络进行训练。
5.根据权利要求4所述的视频高动态范围反色调映射模型构建方法,其特征在于:所述逆伽玛映射预处理,其中:图像的伽玛值若已知,则使用已知的图像伽玛值,如果未知,则使用默认的γ=2.2。
6.根据权利要求1所述的视频高动态范围反色调映射模型构建方法,其特征在于:所述视频生成网络为带有跳跃链接的编码器-解码器形式,编码器与解码器之间是由残差块组成的瓶颈层;其中:
编码器每级包含依次连接的三维卷积层、三维批归一化层以及三维最大池化层;解码器每级包含依次连接的三维反卷积层,三维卷积层以及三维批归一化层;
编码器与解码器之间的瓶颈层,其中每个残差块包含依次连接的三维卷积层、三维批归一化层以及跳跃链接;其中,编码器的第i级与解码器的第i级有跳跃式连接,1≤i≤n,n为总级数。
7.根据权利要求1所述的视频高动态范围反色调映射模型构建方法,其特征在于:所述由空间特征、时域特征、本征特征和感知特征综合的目标损失函数为:
其中,VH、分别表示经过网络生成的高动态范围视频和对应的目标高动态范围视频输出,表示视频整体的内容损失,其中包含了空间特征与时域特征,表示本征损失,为感知损失,α,β是超参数,控制三种损失的比重。
8.根据权利要求7所述的视频高动态范围反色调映射模型构建方法,其特征在于:所述通过整个视频序列的均方误差进行计算;
被写为:
Iill,Iref分别表示每一帧图像经过本征图分解后得到的照度图与反射图,i表示视频中的第i帧;VH、分别表示经过网络生成的高动态范围视频和对应的目标高动态范围视频输出。
9.一种视频高动态范围反色调映射模型构建装置,包括:处理器和存储器,其特征在于:所述存储器中存储有程序指令,所述处理器用于调取所述程序指令以执行权利要求1-8中任一项所述的视频高动态范围反色调映射模型构建方法。
10.一种视频高动态范围反色调映射方法,采用上述权利要求1-8任一项所述方法得到的能完成反色调映射的网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910840429.4/1.html,转载请声明来源钻瓜专利网。