[发明专利]视频生成方法、装置、设备和介质在审
申请号: | 202310402877.2 | 申请日: | 2023-04-14 |
公开(公告)号: | CN116416560A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 袁苇航;孙高峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/22;G06V10/82 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 黄立伟 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 设备 介质 | ||
本公开提供了一种视频生成方法、装置、设备和介质,涉及人工智能技术领域,具体为计算机视觉、深度学习等技术领域,可应用于AIGC等场景。具体实现方案为:通过目标检测获取原视频的目标检测框集合;对所述目标检测框集合中出现的各目标进行追踪,获取所述各目标在所述原视频中的目标追踪框集合,其中,所述各目标的目标追踪框集合用于表示各目标在所述原视频的时序上空间位置的动态变化信息;根据所述目标追踪框集合获取所述原视频中每个原视频帧的选定目标追踪框,并根据所述选定目标追踪框确定所述每个原视频帧的裁剪框;根据所述裁剪框对所述每个原视频帧进行裁剪,根据经所述裁剪得到的帧序列生成目标视频。本公开可以提高生成视频的质量。
技术领域
本公开涉及人工智能技术领域,具体为计算机视觉、深度学习等技术领域,可应用于AIGC等场景。具体涉及一种视频生成方法、装置、设备和介质。
背景技术
AIGC即自动化内容生成,是目前新兴并且飞速发展的一项新的人工智能领域,受到了广泛和强烈的关注。随着5G大带宽网络时代的到来,人们对更具有视觉表现力的数字内容越来越渴望。传统数字内容的生成效率已成为新时代的瓶颈。作为下一个探索热点,AIGC激发了大量行业需求,也让我们看到了人工智能技术新的引爆点。
由于大多数已有的视频素材都是4:3或者16:9的横屏视频,因此通过AIGC重新合成的视频也都是横屏的,这对于手机等移动端播放的用户体验不是很好,而通过视频横转竖技术可以对已有的AIGC生产的视频进行直接处理,使其快速转换成指定长宽比的竖屏视频,方便在手机等移动端的播放。
发明内容
本公开提供了一种视频生成方法、装置、设备和介质。
根据本公开的一方面,提供了一种视频生成方法,包括:
通过目标检测获取原视频的目标检测框集合;
对所述目标检测框集合中出现的各目标进行追踪,获取所述各目标在所述原视频中的目标追踪框集合,其中,所述各目标的目标追踪框集合用于表示各目标在所述原视频的时序上空间位置的动态变化信息;
根据所述目标追踪框集合获取所述原视频中每个原视频帧的选定目标追踪框,并根据所述选定目标追踪框确定所述每个原视频帧的裁剪框;
根据所述裁剪框对所述每个原视频帧进行裁剪,根据经所述裁剪得到的帧序列生成目标视频。
根据本公开的另一方面,提供了一种视频生成装置,包括:
目标检测模块,用于通过目标检测获取原视频的目标检测框集合;
追踪模块,用于对所述目标检测框集合中出现的各目标进行追踪,获取所述各目标在所述原视频中的目标追踪框集合,其中,所述各目标的目标追踪框集合用于表示各目标在所述原视频的时序上空间位置的动态变化信息;
裁剪框确定模块,用于根据所述目标追踪框集合获取所述原视频中每个原视频帧的选定目标追踪框,并根据所述选定目标追踪框确定所述每个原视频帧的裁剪框;
视频生成模块,用于根据所述裁剪框对所述每个原视频帧进行裁剪,根据经所述裁剪得到的帧序列生成目标视频。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任意实施例所述的视频生成方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行本公开任意实施例所述的视频生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310402877.2/2.html,转载请声明来源钻瓜专利网。