[发明专利]一种相似视频的检索方法、装置和存储介质有效

申请号：	201710331203.2	申请日：	2017-05-11
公开（公告）号：	CN107066621B	公开（公告）日：	2022-11-08
发明（设计）人：	张媛媛;于群;占飞;华枭;張永燊;熊磊	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F16/78	分类号：	G06F16/78;G06F16/73;G06F16/33
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	黄威
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种相似视频检索方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种相似视频的检索方法，其特征在于，包括：

获取需要检索相似视频的视频信息，所述视频信息包括视频标签和视频标题；

从所述视频标签和视频标题中抽取实体词，得到种子；

根据预设知识图谱确定与所述种子具有强关联关系的实体词，得到候选词；

从视频库中获取视频信息中包含所述候选词的视频，得到第一候选视频集合；

采用预设文本深度表示模型对所述视频信息进行训练，以将所述视频信息转化为词向量；

根据词向量从所述视频库中筛选与所述视频信息相似的视频，得到第二候选视频集合；

根据所述第一候选视频集合和第二候选视频集合确定所述视频信息的相似视频。

2.根据权利要求1所述的方法，其特征在于，所述根据预设知识图谱确定与所述种子具有强关联关系的实体词，得到候选词，包括：

将所述种子映射到预设实体库中的实体词上，所述实体库根据预设知识图谱建立而成；

确定所述种子与所述实体库中各个实体词的关系度；

选取关系度小于等于设定值的实体词作为候选词。

3.根据权利要求2所述的方法，其特征在于，所述将所述种子映射到预设实体库中的实体词上之前，还包括：

设置基础词库；

根据所述基础词库获取互联网信息，并对所述互联网信息进行非实体词清洗；

根据所述基础词库、以及清洗后的互联网信息构建实体词之间的三元组关系，得到实体库。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述采用预设文本深度表示模型对所述视频信息进行训练，以将所述视频信息转化为词向量，包括：

对所述视频标签和视频标题进行分词，得到分词后视频文本；

采用预设文本深度表示模型对所述分词后视频文本进行训练，得到所述分词后视频文本的词向量；

所述根据词向量从所述视频库中筛选与所述视频信息相似的视频，得到第二候选视频集合，包括：

根据所述分词后视频文本的词向量从所述视频库中筛选与所述视频信息相似的视频，得到第二候选视频集合。

5.根据权利要求4所述的方法，其特征在于，所述根据所述分词后视频文本的词向量从所述视频库中筛选与所述视频信息相似的视频，得到第二候选视频集合，包括：

根据所述分词后视频文本的词向量，分别计算所述视频信息与所述视频库中各个视频的相似度；

选取相似度高于预设阈值的视频，得到第二候选视频集合中。

6.根据权利要求4所述的方法，其特征在于，采用预设文本深度表示模型对所述分词后视频文本进行训练之前，还包括：

获取预设的语料集，并对所述语料集中的句子进行分词；

根据分词后的句子对预设原始模型进行学习，得到文本深度表示模型。

7.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述第一候选视频集合和第二候选视频集合确定所述视频信息的相似视频，包括：

分别对所述第一候选视频集合中的视频进行评分，得到第一分数值；

分别对所述第二候选视频集合中的视频进行评分，得到第二分数值；

分别计算所述第一分数值和相应的第二分数值的加权值，得到各个视频的综合分数值；

将综合分数值大于预设分数值的视频确定为所述视频信息的相似视频。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710331203.2/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载