[发明专利]视频生成方法、装置、设备和介质在审

申请号：	202310402877.2	申请日：	2023-04-14
公开（公告）号：	CN116416560A	公开（公告）日：	2023-07-11
发明（设计）人：	袁苇航;孙高峰	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06V20/40	分类号：	G06V20/40;G06V10/22;G06V10/82
代理公司：	北京品源专利代理有限公司 11332	代理人：	黄立伟
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频生成方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种视频生成方法、装置、设备和介质，涉及人工智能技术领域，具体为计算机视觉、深度学习等技术领域，可应用于AIGC等场景。具体实现方案为：通过目标检测获取原视频的目标检测框集合；对所述目标检测框集合中出现的各目标进行追踪，获取所述各目标在所述原视频中的目标追踪框集合，其中，所述各目标的目标追踪框集合用于表示各目标在所述原视频的时序上空间位置的动态变化信息；根据所述目标追踪框集合获取所述原视频中每个原视频帧的选定目标追踪框，并根据所述选定目标追踪框确定所述每个原视频帧的裁剪框；根据所述裁剪框对所述每个原视频帧进行裁剪，根据经所述裁剪得到的帧序列生成目标视频。本公开可以提高生成视频的质量。

技术领域

本公开涉及人工智能技术领域，具体为计算机视觉、深度学习等技术领域，可应用于AIGC等场景。具体涉及一种视频生成方法、装置、设备和介质。

背景技术

AIGC即自动化内容生成，是目前新兴并且飞速发展的一项新的人工智能领域，受到了广泛和强烈的关注。随着5G大带宽网络时代的到来，人们对更具有视觉表现力的数字内容越来越渴望。传统数字内容的生成效率已成为新时代的瓶颈。作为下一个探索热点，AIGC激发了大量行业需求，也让我们看到了人工智能技术新的引爆点。

由于大多数已有的视频素材都是4:3或者16:9的横屏视频，因此通过AIGC重新合成的视频也都是横屏的，这对于手机等移动端播放的用户体验不是很好，而通过视频横转竖技术可以对已有的AIGC生产的视频进行直接处理，使其快速转换成指定长宽比的竖屏视频，方便在手机等移动端的播放。

发明内容

本公开提供了一种视频生成方法、装置、设备和介质。

根据本公开的一方面，提供了一种视频生成方法，包括：

通过目标检测获取原视频的目标检测框集合；

对所述目标检测框集合中出现的各目标进行追踪，获取所述各目标在所述原视频中的目标追踪框集合，其中，所述各目标的目标追踪框集合用于表示各目标在所述原视频的时序上空间位置的动态变化信息；

根据所述目标追踪框集合获取所述原视频中每个原视频帧的选定目标追踪框，并根据所述选定目标追踪框确定所述每个原视频帧的裁剪框；

根据所述裁剪框对所述每个原视频帧进行裁剪，根据经所述裁剪得到的帧序列生成目标视频。