[发明专利]视频的自动裁剪切换方法及系统、视频播放器及存储介质有效
申请号: | 202111576101.X | 申请日: | 2021-12-21 |
公开(公告)号: | CN114257757B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 张明;董健 | 申请(专利权)人: | 睿魔智能科技(深圳)有限公司 |
主分类号: | H04N5/262 | 分类号: | H04N5/262;H04N5/76;G06T7/11;G06V20/40;G06V40/16;G06V40/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 自动 裁剪 切换 方法 系统 播放 存储 介质 | ||
1.一种视频的自动裁剪切换方法,其特征在于,所述视频的自动裁剪切换方法包括:
A、基于视频图像序列图像获取优先级别从低到高依次排列的全景视图、起立人物视图、特写视图的参数信息,其中,所述参数信息包括边界框信息及状态信息;
B、确定当前输出视图的输出时间已超过阈值;
C、若所述起立人物视图中只有一起立人物正在说话,则所述特写视图的状态信息为有效,根据特写视图的边界框信息从视频图像序列中裁剪特写视图并输出;否则,若所述全景视图中至少有一起立人物,则所述起立人物视图的状态信息为有效,根据起立人物视图的边界框信息从视频图像序列中裁剪起立人物视图并输出;否则,输出全景视图;
所述特写视图参数信息的获取具体包括:
对视频图像帧序列进行人物检测,获取当前帧视频图像中每一起立人物的人物检测信息,其中所述人物检测信息包括:人脸特征信息、嘴唇特征信息及坐标信息;
根据所述人物检测信息维护人物位置序列表;
根据所述人物位置序列表中的嘴唇特征信息确定只有一个起立人物正在说话;
将获取的该正在说话的起立人物的特写画面对应的边界框信息作为特写视图的边界框信息,将特写视图的状态信息设置为有效;
所述根据所述人物位置序列表中的嘴唇特征信息确定只有一个起立人物正在说话包括:
依次将每一起立人物对应的人物位置序列信息中的嘴唇特征信息从当前帧开始并按间隔N帧的方式往回抽取K帧,将抽取的K帧视频图像对应的嘴唇特征信息送入说话分类器中,得到每一起立人物的实时得分;
对每一起立人物前M次计算的实时得分进行平均值计算,得到当前帧视频图像的说话得分,若所述说话得分大于等于预设阈值,则判断出该起立人物正在说话;
统计正在说话的起立人物的数量,若正在说话的起立人物的数量等于1,则确定只有一个起立人物正在说话。
2.根据权利要求1所述的视频的自动裁剪切换方法,其特征在于,所述起立人物视图的获取具体为:
获取从全景视图中直接裁剪包含所有起立人物的边界框的最小视图作为起立人物视图;或者
获取每一起立人物的独立边界框,对所有起立人物的独立边界框进行区域融合,得到起立人物视图。
3.根据权利要求2所述的视频的自动裁剪切换方法,其特征在于,所述获取每一起立人物的独立边界框,对所有起立人物的独立边界框进行区域融合,得到起立人物视图具体包括:
获取每一起立人物的独立边界框;
将每一起立人物的独立边界框依次进行伸缩拼接以使每一起立人物的长度一致,其中独立边界框的伸缩比例与其原始长宽比一致。
4.根据权利要求1所述的视频的自动裁剪切换方法,其特征在于,所述基于视频图像序列图像获取优先级别从低到高依次排列的全景视图、起立人物视图、特写视图的参数信息具体为:按预置周期基于视频图像序列图像获取优先级别从低到高依次排列的全景视图、起立人物视图和特写视图的参数信息。
5.根据权利要求1所述的视频的自动裁剪切换方法,其特征在于,所述步骤C之后还包括:若当前的输出视图与上一输出视图不是同一优先级别视图,则启动当前输出视图的计时器,以重新计时;否则,计时器继续保持计时。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于睿魔智能科技(深圳)有限公司,未经睿魔智能科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111576101.X/1.html,转载请声明来源钻瓜专利网。