[发明专利]视频聚合方法及装置在审
申请号: | 201710376440.0 | 申请日: | 2017-05-25 |
公开(公告)号: | CN108932252A | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 甘润生;刘云剑;刘尚堃 | 申请(专利权)人: | 合一网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚合 视频 特征词 相似度 | ||
1.一种视频聚合方法,其特征在于,包括:
获取待聚合的各个视频的特征词;
确定播单的主题;
根据待聚合的各个视频的特征词,确定待聚合的各个视频与所述播单的主题的相似度;
根据待聚合的各个视频与所述播单的主题的相似度,确定属于所述播单的视频。
2.根据权利要求1所述的方法,其特征在于,在确定属于所述播单的视频之后,所述方法还包括:
在所述播单满足条件的情况下,确定所述播单的子播单的主题;
根据所述播单中各个视频的特征词,确定所述播单中各个视频与所述子播单的主题的相似度;
根据所述播单中各个视频与所述子播单的主题的相似度,确定属于所述子播单的视频。
3.根据权利要求1所述的方法,其特征在于,根据待聚合的各个视频的特征词,确定待聚合的各个视频与所述播单的主题的相似度,包括:
确定待聚合的各个视频的各个特征词对应的词向量,并确定所述播单的主题对应的词向量;
确定待聚合的各个视频的各个特征词的词频与逆文档词频,并确定所述播单的主题的词频与逆文档词频;
根据待聚合的各个视频的各个特征词对应的词向量、待聚合的各个视频的各个特征词的词频与逆文档词频、所述播单的主题对应的词向量以及所述播单的主题的词频与逆文档词频,确定待聚合的各个视频与所述播单的主题的相似度。
4.根据权利要求1所述的方法,其特征在于,在确定属于所述播单的视频之后,所述方法还包括:
根据待聚合的各个视频的上传时间和上传者类型中的一项或两项,对所述播单进行筛选,得到筛选后的播单。
5.根据权利要求2所述的方法,其特征在于,所述条件包括以下至少一项:
所述播单中视频的个数大于第一阈值;
所述播单中的各个视频与所述播单的主题的相似度的平均值小于第二阈值。
6.根据权利要求2所述的方法,其特征在于,确定所述播单的子播单的主题,包括:
根据所述播单中各个视频的特征词对应的视频个数,确定所述播单的子播单的主题。
7.一种视频聚合装置,其特征在于,包括:
获取模块,用于获取待聚合的各个视频的特征词;
第一确定模块,用于确定播单的主题;
第二确定模块,用于根据待聚合的各个视频的特征词,确定待聚合的各个视频与所述播单的主题的相似度;
第三确定模块,用于根据待聚合的各个视频与所述播单的主题的相似度,确定属于所述播单的视频。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第四确定模块,用于在所述播单满足条件的情况下,确定所述播单的子播单的主题;
第五确定模块,用于根据所述播单中各个视频的特征词,确定所述播单中各个视频与所述子播单的主题的相似度;
第六确定模块,用于根据所述播单中各个视频与所述子播单的主题的相似度,确定属于所述子播单的视频。
9.根据权利要求7所述的装置,其特征在于,所述第二确定模块包括:
第一确定子模块,用于确定待聚合的各个视频的各个特征词对应的词向量,并确定所述播单的主题对应的词向量;
第二确定子模块,用于确定待聚合的各个视频的各个特征词的词频与逆文档词频,并确定所述播单的主题的词频与逆文档词频;
第三确定子模块,用于根据待聚合的各个视频的各个特征词对应的词向量、待聚合的各个视频的各个特征词的词频与逆文档词频、所述播单的主题对应的词向量以及所述播单的主题的词频与逆文档词频,确定待聚合的各个视频与所述播单的主题的相似度。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
筛选模块,用于根据待聚合的各个视频的上传时间和上传者类型中的一项或两项,对所述播单进行筛选,得到筛选后的播单。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合一网络技术(北京)有限公司,未经合一网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710376440.0/1.html,转载请声明来源钻瓜专利网。