[发明专利]视频生成方法、装置、设备和介质在审
申请号: | 202310402877.2 | 申请日: | 2023-04-14 |
公开(公告)号: | CN116416560A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 袁苇航;孙高峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/22;G06V10/82 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 黄立伟 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 生成 方法 装置 设备 介质 | ||
1.一种视频生成方法,包括:
通过目标检测获取原视频的目标检测框集合;
对所述目标检测框集合中出现的各目标进行追踪,获取所述各目标在所述原视频中的目标追踪框集合,其中,所述各目标的目标追踪框集合用于表示各目标在所述原视频的时序上空间位置的动态变化信息;
根据所述目标追踪框集合获取所述原视频中每个原视频帧的选定目标追踪框,并根据所述选定目标追踪框确定所述每个原视频帧的裁剪框;
根据所述裁剪框对所述每个原视频帧进行裁剪,根据经所述裁剪得到的帧序列生成目标视频。
2.根据权利要求1所述的方法,其中,所述通过目标检测获取原视频的目标检测框集合,包括:
按照第一间隔帧数从所述原视频的原视频帧中进行抽帧,获取第一视频帧集合,并将所述第一视频帧集合作为待检测视频帧集合;
对所述待检测视频帧集合中的每个待检测视频帧进行目标检测,得到所述原视频的目标检测框集合。
3.根据权利要求2所述的方法,其中,所述对所述待检测视频帧集合中的每个待检测视频帧进行目标检测,得到所述原视频的目标检测框集合,包括:
利用目标检测算法获取所述每个待检测视频帧的第一检测框集合;
如果存在第一检测框集合为空的任意目标待检测视频帧,则利用显著性检测算法获取所述目标待检测视频帧的第二检测框集合;
根据所述第一检测框集合和所述第二检测框集合得到所述原视频的目标检测框集合。
4.根据权利要求3所述的方法,其中,所述第一检测框集合包括人脸检测框和人体检测框。
5.根据权利要求3所述的方法,其中,所述第一检测框集合中的每个第一检测框的面积均大于第一阈值。
6.根据权利要求3所述的方法,其中,所述利用显著性检测算法获取所述目标待检测视频帧的第二检测框集合,包括:
利用显著性检测算法获取所述目标待检测视频帧的显著图;
基于第二阈值对所述显著图进行二值化,得到所述显著图的二值图;
计算所述二值图的八邻域连通区域,并对其中除背景区域以外的每个连通区域计算矩形包围框;
在所述矩形包围框中按照第一条件进行筛选,获取所述第二检测框集合。
7.根据权利要求6所述的方法,其中,所述第一条件包括:
矩形包围框的高和宽均大于0,并且矩形包围框的面积大于第三阈值,并且所述高和宽中的较大值除以较小值的得数小于第四阈值。
8.根据权利要求2所述的方法,其中,所述对所述目标检测框集合中出现的各目标进行追踪,获取所述各目标在所述原视频中的目标追踪框集合,包括:
按照第二间隔帧数从所述原视频的原视频帧中进行抽帧,获取第二视频帧集合,并将所述第二视频帧集合作为待追踪视频帧集合;
在所述待追踪视频帧集合中,对所述目标检测框集合中出现的各目标进行追踪,获取所述各目标在每个待追踪视频帧中的目标追踪框;
根据同一目标的相邻的两个目标追踪框,在该两个目标追踪框各自所属的待追踪视频帧之间的其他原视频帧中进行插帧,获取该同一目标在所述其他原视频帧中的目标追踪框;
根据经所述追踪获取的目标追踪框和经所述插帧获取的目标追踪框,组成所述各目标在所述原视频中的目标追踪框集合。
9.根据权利要求8所述的方法,其中,所述第一间隔帧数是所述第二间隔帧数的整数倍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310402877.2/1.html,转载请声明来源钻瓜专利网。