[发明专利]基于时域一致性约束的视频风格迁移方法有效
| 申请号: | 201910409352.5 | 申请日: | 2019-05-16 |
| 公开(公告)号: | CN110175951B | 公开(公告)日: | 2022-12-02 |
| 发明(设计)人: | 董伟生;张珍;谢雪梅;石光明;孙璐 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06T3/00 | 分类号: | G06T3/00 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
| 地址: | 710071 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 时域 一致性 约束 视频 风格 迁移 方法 | ||
1.一种基于时域一致性约束的视频风格迁移方法,其特征在于,包括如下步骤:
(1)根据视频训练集V和风格图像a,离线计算光流信息:
(1a)获取视频训练集V和风格图像a,其中V中包含N组视频序列,每组视频序列Ιn包括四幅图像,分别为一段视频的第1帧I1,第4帧I4,第6帧I6和第7帧I7,其中n={1,2,...,N};
(1b)通过变分光流法计算不同帧图像之间的光流信息和光流置信度信息Cn={c(1,7),c(4,7),c(6,7)},其中表示第i帧到第7帧的光流信息,c(i,7)表示第i帧与第7帧之间的光流置信度矩阵,其中,i∈{1,4,6};
(2)构建基于时域一致性约束的视频风格迁移网络:
(2a)设计风格转换网络,该网络包括依次连接的三个底层卷积层、五个残差模块、两个反卷积层和一个高层卷积层;将底层第一个卷积层的输出输入到第二个反卷积层中,将底层第二个卷积层的输出输入到第一个反卷积层中,形成两个跳跃连接;
(2b)设置训练参数,随机初始化风格转换网络的权值σ0和偏置值β0;
(3)训练基于时域一致性约束的视频风格转换网络模型:
(3a)每次从视频训练集V中选择一组视频In,以及它对应的光流信息Wn、光流置信度信息Cn,作为训练样本,其中n={1,2,...,N};
(3b)将训练样本输入到风格转换网络生成风格化结果Pn,Pn={P1,P4,P6,P7};
(3c)计算风格化结果的总损失值LT:
LT=λsLs+λcLc+λvLv+λtLt,
其中,Ls表示风格损失值、Lc表示内容损失值、Lv表示全变分损失值、Lt表示时域损失值,λs表示风格损失权重,λc表示内容损失权重,λv表示全变分损失权重,λt表示时域损失权重;
(3d)使用总损失值LT训练风格转换网络模型,更新风格转换网络模型的权值σ和偏置值β;
(3e)循环进行(3a)-(3d)对风格转换网络模型进行迭代优化训练,直到取完视频训练集V中所有的视频序列组,得到训练好的风格转换网络模型;
(4)利用训练好的视频风格转换模型对测试视频进行风格迁移,即将一段测试视频输入到训练好的风格转换网络模型中,风格转换网络模型的输出即为具有时域一致性的风格化视频。
2.根据权利要求1所述的方法,其特征在于,(2a)中的风格转换网络,其结构参数如下:
第一底层卷积层的卷积核大小为9×9,卷积核数量为32,步长为1;
第二底层卷积层的卷积核大小为3×3,卷积核数量为64,步长为2;
第三底层卷积层的卷积核大小为3×3,卷积核数量为128,步长为2;
第一残差模块的卷积核大小为3×3,卷积核数量为128,步长为1;
第二残差模块的卷积核大小为3×3,卷积核数量为128,步长为1;
第三残差模块的卷积核大小为3×3,卷积核数量为128,步长为1;
第四残差模块的卷积核大小为3×3,卷积核数量为128,步长为1;
第五残差模块的卷积核大小为3×3,卷积核数量为128,步长为1;
第一反卷积层的卷积核大小为3×3,卷积核数量为64,步长为0.5;
第二反卷积层的卷积核大小为3×3,卷积核数量为32,步长为0.5;
最后一层高层卷积层的卷积核大小为9×9,卷积核数量3,步长为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910409352.5/1.html,转载请声明来源钻瓜专利网。





