[发明专利]原版视频识别方法及装置在审
申请号: | 202010709260.1 | 申请日: | 2020-07-21 |
公开(公告)号: | CN111783734A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;H04N21/234;H04N21/44 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 原版 视频 识别 方法 装置 | ||
1.一种原版视频识别方法,其特征在于,所述方法包括:
获取待处理的多个视频的特征信息,所述特征信息包括标题和封面;
对所述多个视频的特征信息进行聚类得到多个视频封面类簇;
获取所述多个视频封面类簇中每个视频封面类簇包括的视频的封面之间的相似度;
根据所述相似度从所述多个视频封面类簇包括的视频中确定出原版视频。
2.根据权利要求1所述的方法,其特征在于,所述多个视频封面类簇中每个视频封面类簇包括的视频的数量达到第一数量阈值,所述根据所述相似度从所述多个视频封面类簇包括的视频中确定出原版视频,包括:
针对所述每个视频封面类簇,获取所述相似度达到相似度阈值的视频在所述每个视频封面类簇中的数量占比;
确定所述每个视频封面类簇中对应的数量占比最高的多个候选视频;
根据发布时间从所述多个候选视频中确定出原版视频。
3.根据权利要求2所述的方法,其特征在于,所述根据发布时间从所述多个候选视频中确定出原版视频,包括:
比较所述每个视频封面类簇中对应的数量占比最高的多个候选视频的发布时间;
将发布时间最早的候选视频作为原版视频。
4.根据权利要求1所述的方法,其特征在于,所述对所述多个视频的特征信息进行聚类得到多个视频封面类簇,包括:
对所述多个视频的标题进行文本聚类得到多个视频标题类簇;
根据所述多个视频标题类簇确定目标视频集合;
对所述目标视频集合中的视频的封面进行图像聚类得到多个视频封面类簇。
5.根据权利要求4所述的方法,其特征在于,所述对所述多个视频的标题进行文本聚类得到多个视频标题类簇,包括:
对所述多个视频中的每个视频的标题进行向量化处理,得到与所述多个视频的标题对应的多个标题向量;
对所述多个标题向量进行文本聚类得到多个视频标题类簇。
6.根据权利要求4所述的方法,其特征在于,所述对所述目标视频集合中的视频的封面进行图像聚类得到多个视频封面类簇,包括:
提取所述目标视频集合中每个视频的封面的图像特征,得到与所述目标视频集合包括的多个视频对应的多个图像特征;
对所述多个图像特征进行图像聚类得到多个视频封面类簇。
7.根据权利要求1所述的方法,其特征在于,所述获取所述多个视频封面类簇中每个视频封面类簇包括的视频的封面之间的相似度,包括:
获取所述多个视频封面类簇中每个视频封面类簇包括的视频的封面的哈希值;
根据所述哈希值计算所述每个视频封面类簇包括的任意两个视频的封面之间的汉明距离;
根据所述汉明距离确定所述任意两个视频的封面之间的相似度。
8.根据权利要求4所述的方法,其特征在于,所述根据所述多个视频标题类簇确定目标视频集合,包括:
获取所述多个视频标题类簇中每个视频标题类簇包括的视频的数量;
从所述多个视频标题类簇中确定出包括的视频的数量达到第二数量阈值的目标视频标题类簇;
根据所述目标视频标题类簇包括的视频确定目标视频集合。
9.一种原版视频识别装置,其特征在于,所述原版视频识别装置包括通信单元,处理单元,其中:
所述处理单元,用于获取待处理的多个视频的特征信息,所述特征信息包括标题和封面;
所述处理单元,还用于对所述多个视频的特征信息进行聚类得到多个视频封面类簇;
所述处理单元,还用于获取所述多个视频封面类簇中每个视频封面类簇包括的视频的封面之间的相似度;
所述处理单元,还用于根据所述相似度从所述多个视频封面类簇包括的视频中确定出原版视频。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-8任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010709260.1/1.html,转载请声明来源钻瓜专利网。