[发明专利]一种视频检测方法、装置、电子设备和存储介质有效
申请号: | 202110792857.1 | 申请日: | 2021-07-14 |
公开(公告)号: | CN113255625B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 束俊辉;刘振华 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱佳 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 检测 方法 装置 电子设备 存储 介质 | ||
1.一种视频检测方法,其特征在于,该方法包括:
获取待检测视频的深度语义特征,所述深度语义特征表征所述待检测视频中图像的内容信息;
基于所述深度语义特征,将所述待检测视频与各个候选视频进行匹配,获得所述待检测视频对应的至少两个候选视频,以及所述至少两个候选视频各自与所述待检测视频的初始相似度;
基于获得的各个初始相似度,确定所述待检测视频对应的相似度参考值,并分别将所述至少两个候选视频各自对应的初始相似度与所述相似度参考值的差值,作为相应的候选视频对应的目标相似度;
基于获得的各个目标相似度,将所述至少两个候选视频中对应的目标相似度大于第二预设阈值的候选视频,作为所述待检测视频的重复视频,所述第二预设阈值是基于预设关系确定的与所述待检测视频的场景对应的阈值;以及,
基于所述各个目标相似度,对所述至少两个候选视频进行排序,获得所述待检测视频对应的候选视频序列;按照所述候选视频序列中的所述至少两个候选视频之间的顺序,分别确定所述至少两个候选视频各自对应的推荐权重;按照获得的各个推荐权重,对相应的候选视频进行推荐。
2.如权利要求1所述的方法,其特征在于,所述深度语义特征为对应设定维度的深度语义向量;所述基于所述深度语义特征,将所述待检测视频与各个候选视频进行匹配,获得所述待检测视频对应的至少两个候选视频,包括:
分别基于所述待检测视频的深度语义向量,与所述各个候选视频的深度语义向量之间的距离,确定相应的候选视频与所述待检测视频的初始相似度;
选取对应的初始相似度满足预设关联关系的至少两个候选视频。
3.如权利要求2所述的方法,其特征在于,所述预设关联关系包括:
初始相似度次序符合预设排序位置,其中所述初始相似度次序是基于所述各个候选视频各自对应的初始相似度,对所述各个候选视频进行排序后确定的;
或者,
初始相似度超过第一预设阈值。
4.如权利要求1所述的方法,其特征在于,所述基于获得的各个初始相似度,确定所述待检测视频对应的相似度参考值,包括:
将所述各个初始相似度的平均值、中值、方差中的至少一种,作为所述相似度参考值。
5.如权利要求1所述的方法,其特征在于,所述获取待检测视频的深度语义特征,包括:
对所述待检测视频进行抽帧处理,获得至少两个目标视频帧;
分别对所述至少两个目标视频帧进行特征提取,获取所述至少两个目标视频帧各自对应的帧图像特征;
对获得的各个帧图像特征进行特征聚合,获得所述待检测视频的深度语义特征。
6.如权利要求5所述的方法,其特征在于,所述分别对所述至少两个目标视频帧进行特征提取,获取所述至少两个目标视频帧各自对应的帧图像特征,包括:
将所述至少两个目标视频帧输入已训练的多任务模型中的深度图像子网络;
基于所述深度图像子网络对所述至少两个目标视频帧进行特征提取,获取所述至少两个目标视频帧各自对应的帧图像特征;
所述对获得的各个帧图像特征进行特征聚合,获得所述待检测视频的深度语义特征,包括:
将所述各个帧图像特征输入所述多任务模型中的图像特征聚合子网络;
基于所述图像特征聚合子网络,对所述各个帧图像特征进行特征聚合,获得所述深度语义特征;
其中,所述多任务模型是基于训练样本数据集训练得到的,所述多任务模型对应的多任务至少包括视频分类任务和视频标签提取任务;所述训练样本数据集包括多个训练样本,每个训练样本包括一个样本视频,以及所述样本视频对应的真实类别和标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110792857.1/1.html,转载请声明来源钻瓜专利网。