[发明专利]基于时域一致性约束的视频风格迁移方法有效
| 申请号: | 201910409352.5 | 申请日: | 2019-05-16 |
| 公开(公告)号: | CN110175951B | 公开(公告)日: | 2022-12-02 |
| 发明(设计)人: | 董伟生;张珍;谢雪梅;石光明;孙璐 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06T3/00 | 分类号: | G06T3/00 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
| 地址: | 710071 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于时域一致性约束的视频风格迁移方法,主要解决现有技术在视频风格迁移中出现的闪烁、前后不连贯的问题。其实现方案为:1)获取视频数据集、风格图像,并离线计算光流信息;2)构建基于时域一致性约束的视频风格转换网络;3)利用视频数据集、风格图像以及光流信息训练风格转换网络模型,更新其各层的权值和偏置;4)将测试视频输入到训练好的风格转换网络模型中,输出结果即为风格化视频。本发明通过训练风格转换网络模型拟合输入视频与风格化视频之间的非线性映射关系,并以这种关系为指导对真实视频进行不同风格的渲染,提高了风格化视频的时域一致性和视觉效果,可用于视频渲染、风格转换的视频处理场景。 | ||
| 搜索关键词: | 基于 时域 一致性 约束 视频 风格 迁移 方法 | ||
【主权项】:
1.一种基于时域一致性约束的视频风格迁移方法,其特征在于,包括如下步骤:(1)根据视频训练集V和风格图像a,离线计算光流信息:(1a)获取视频训练集V和风格图像a,其中V中包含N组视频序列,每组视频序列Ιn包括四幅图像,分别为一段视频的第1帧I1,第4帧I4,第6帧I6和第7帧I7,其中n={1,2,...,N};(1b)通过变分光流法计算不同帧图像之间的光流信息
和光流置信度信息Cn={c(1,7),c(4,7),c(6,7)},其中
表示第i帧到第7帧的光流信息,c(i,7)表示第i帧与第7帧之间的光流置信度矩阵,其中,i∈{1,4,6};(2)构建基于时域一致性约束的视频风格迁移网络:(2a)设计风格转换网络,该网络包括依次连接的三个底层卷积层、五个残差模块、两个反卷积层和一个高层卷积层;将底层第一个卷积层的输出输入到第二个反卷积层中,将底层第二个卷积层的输出输入到第一个反卷积层中,形成两个跳跃连接;(2b)设置训练参数,随机初始化风格转换网络的权值σ0和偏置值β0;(3)训练基于时域一致性约束的视频风格转换网络模型:(3a)每次从视频训练集V中选择一组视频In,以及它对应的光流信息Wn、光流置信度信息Cn,作为训练样本,其中n={1,2,...,N};(3b)将训练样本输入到风格转换网络生成风格化结果Pn,Pn={P1,P4,P6,P7};(3c)计算风格化结果的总损失值LT:LT=λsLs+λcLc+λvLv+λtLt,其中,Ls表示风格损失值、Lc表示内容损失值、Lv表示全变分损失值、Lt表示时域损失值,λs表示风格损失权重,λc表示内容损失权重,λv表示全变分损失权重,λt表示时域损失权重;(3d)使用总损失值LT训练风格转换网络模型,更新风格转换网络模型的权值σ和偏置值β;(3e)循环进行(3a)‑(3d)对风格转换网络模型进行迭代优化训练,直到取完视频训练集V中所有的视频序列组,得到训练好的风格转换网络模型;(4)利用训练好的视频风格转换模型对测试视频进行风格迁移,即将一段测试视频输入到训练好的风格转换网络模型中,风格转换网络模型的输出即为具有时域一致性的风格化视频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910409352.5/,转载请声明来源钻瓜专利网。





