[发明专利]一种短视频去重方法及计算机可读存储介质在审
申请号: | 202210284145.3 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114860991A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 赵舰波;张晓瑾;张善庄;刘怀亮;杨斌;王亚凯 | 申请(专利权)人: | 西安知了科技有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06V10/764;G06V20/40 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 李薇 |
地址: | 710075 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 方法 计算机 可读 存储 介质 | ||
本发明涉及一种短视频去重方法及计算机可读存储介质,方法包括:创建特征数据库,特征数据库包括原始视频的第一关键帧生成的第一特征点描述子;提取目标视频的多个第二关键帧,第二关键帧生成有第二特征点描述子;将第二关键帧的第二特征点描述子与特征数据库中的第一特征点描述子进行匹配,以判断第二关键帧是否已经存在于特征数据库中,若是,则删除第二关键帧对应的目标视频,以得到去重后的视频集。本发明的方法分级分类创建图像标签特征数据库能提高对目标视频识别速度,提高去重效率。本发明的方法通过将第二关键帧的第二特征点描述子与特征数据库中的第一特征点描述子进行匹配,在保证了识别精度的同时也降低了识别成本。
技术领域
本发明属于视频处理技术领域,涉及一种短视频去重方法及计算机可读存储介质。
背景技术
随着自媒体行业的迅速发展,短视频已成为新潮的娱乐和生活方式,越来越多的短视频被创造与传播。从海量视频库中发现相同内容的短视频,去除掉冗余视频,对于短视频运营平台来讲,不仅能够节约大量存储空间便于管理,还能避免同质化视频的泛滥,提高用户观看感。除此之外,对短视频内容去重审核同样也是对视频原创者的版权保护。因此,对重复内容的短视频进行检测和删除具有重要现实意义。
目前,常用的视频去重方法主要有三种:
1、视频的相关信息去重。将目标视频的相关信息(例如标题、作者、描述、封面等)与视频库已有视频相关信息进行遍历对比,以确定重复视频。
2、哈希算法去重。对目标视频按针提取关键帧,对关键帧进行降采样,采用哈希算法计算目标视频与视频库已有视频相似度,常用的哈希算法包括均值哈希算法、差值哈希算法、感知哈希算法。设定一定阈值,当相似度高于阈值则判定为重复视频。
3、特征去重。对目标视频按针提取关键帧,利用卷积神经网络提取目标视频图像特征,用聚类识别目标视频与视频库的相似特征,去除重复视频图像。
当下技术存在缺陷:1、视频去重效率低。通过目标视频的相关信息进行遍历耗时长且只能排除少量重复视频,去重效率并不高。2、视频去重准确度低。通过哈希算法计算视频相似度去重是针对视频全局特征计算相似度,对视频细微的变化并不敏感,去重准确率不是特别高。3、视频去重成本高。卷积神经网络利用特征提取虽然能对识别更细粒度的视频特征,但计算量大且复杂,面对迅速增长的短视频,耗费成本较高。
因此,提供一种去重效率高、准确率高、成本低的方法,成为了亟待解决的问题。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种短视频去重方法及计算机可读存储介质。本发明要解决的技术问题通过以下技术方案实现:
本发明实施例提供了一种短视频去重方法,所述短视频去重方法包括:
步骤1、创建特征数据库,所述特征数据库包括原始视频的第一关键帧生成的第一特征点描述子,所有所述第一特征点描述子按照标签层级存放于所述特征数据库中;
步骤2、提取目标视频的多个第二关键帧,所述第二关键帧生成有第二特征点描述子;
步骤3、将所述第二关键帧的第二特征点描述子与所述特征数据库中的第一特征点描述子进行匹配,以判断所述第二关键帧是否已经存在于所述特征数据库中,若是,则删除所述第二关键帧对应的目标视频,以得到去重后的视频集。
在本发明的一个实施例中,所述步骤1包括:
步骤1.1、获取所述原始视频;
步骤1.2、利用光流法计算所述原始视频的视频帧中物体运动的光流量,提取光流移动次数最少的视频帧,将光流移动次数最少的视频帧作为第一关键帧;
步骤1.3、识别所述第一关键帧中的视觉内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安知了科技有限公司,未经西安知了科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210284145.3/2.html,转载请声明来源钻瓜专利网。