[发明专利]一种视频查询方法及装置在审
申请号: | 201910120405.1 | 申请日: | 2019-02-18 |
公开(公告)号: | CN109783690A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 王天畅;陈英傑;叶澄灿;何咏倩 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/735;G06F16/732 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询词 视频 匹配 语义相似度 视频查询 相似度 查询 预设 查询结果 目标视频 申请 | ||
1.一种视频查询方法,其特征在于,所述方法包括:
获取用户输入的待处理查询词;
根据所述待处理查询词获取待处理扩展词,所述待处理扩展词与所述待处理查询词的语义相似度大于或等于预设相似度;
查询与所述待处理查询词匹配的视频,以及与所述待处理扩展词匹配的视频,作为与所述待处理查询词对应的目标视频。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待处理查询词获取待处理扩展词,包括:
将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词;所述机器学习模型基于历史查询词以及历史扩展词训练得到,所述历史扩展词为历史视频的标题文本,所述历史视频基于所述历史查询词被查询到且被用户选择。
3.根据权利要求2所述的方法,其特征在于,所述机器学习模型基于以下方式训练得到:
对所述历史查询词进行分词,得到至少一个第一分词结果;
对所述历史扩展词进行分词,得到至少一个第二分词结果;
基于所述第一分词结果和所述第二分词结果的对齐关系,得到对齐词组;
基于所述对齐词组对所述机器学习模型进行训练。
4.根据权利要求3所述的方法,其特征在于,所述将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词,包括:
将所述待处理查询词输入机器学习模型中,以便所述机器学习模型对所述待处理查询词进行分词,得到第三分词结果以及与所述第三分词结果对齐的第四分词结果,根据所述第四分词结果得到待处理扩展词,并输出所述待处理扩展词。
5.根据权利要求2所述的方法,其特征在于,所述将所述待处理查询词输入机器学习模型,得到所述机器学习模型输出的待处理扩展词,包括:
将所述待处理查询词输入机器学习模型,得到所述机器学习模型的至少一个输出结果;
利用分类模型得到所述输出结果的得分,将所述得分高于或等于阈值的输出结果作为待处理扩展词。
6.根据权利要求1所述的方法,其特征在于,所述根据所述待处理查询词获取待处理扩展词,包括:
根据所述待处理查询词,在预先建立的近义词库中查找待处理扩展词,所述近义词库中包括预先对应存储的所述待处理查询词,以及与所述待处理查询词的语义相似度大于或等于预设相似度的词。
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述方法还包括:
根据与所述目标视频匹配的所述待处理查询词的数量,和与所述目标视频匹配的所述待处理扩展词的数量,确定所述目标视频与所述待处理查询词的相关度;
显示所述相关度大于或等于预设值的目标视频以供用户选择。
8.根据权利要求7所述的方法,其特征在于,所述根据与所述目标视频匹配的所述待处理查询词的数量,和与所述目标视频匹配的所述待处理扩展词的数量,确定所述目标视频与所述待处理查询词的相关度,包括:
为所述待处理查询词确定第一权重,为所述待处理扩展词确定第二权重;
计算与所述目标视频匹配的所述待处理查询词的数量与第一权重的第一乘积,以及与所述目标视频匹配的所述待处理扩展词的数量与第二权重的第二乘积;
将所述第一乘积和所述第二乘积的和,作为所述目标视频与所述待处理查询词的相关度。
9.一种视频查询装置,其特征在于,所述装置包括:
查询词获取单元,用于获取用户输入的待处理查询词;
扩展词获取单元,用于根据所述待处理查询词获取待处理扩展词,所述待处理扩展词与所述待处理查询词的语义相似度大于或等于预设相似度;
视频查询单元,用于查询与所述待处理查询词匹配的视频,以及与所述待处理扩展词匹配的视频,作为与所述待处理查询词对应的目标视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910120405.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法、装置及电子设备
- 下一篇:一种深度学习和哈希编码的视频检索方法