[发明专利]视频节目的搜索方法和装置有效

专利信息
申请号: 201611019485.4 申请日: 2016-11-18
公开(公告)号: CN106708929B 公开(公告)日: 2020-06-26
发明(设计)人: 李贤 申请(专利权)人: 广州视源电子科技股份有限公司
主分类号: G06F16/783 分类号: G06F16/783;G06F16/71
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 麦小婵;郝传鑫
地址: 510530 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 节目 搜索 方法 装置
【权利要求书】:

1.一种视频节目的搜索方法,其特征在于,包括:

接收用户输入的描述视频节目的描述词条和所述视频节目所属的视频类别;

选取与所述视频类别相对应的潜在语义索引模型,并根据所述语义索引模型的索引矩阵的构建方式,构建所述描述词条的查询向量;其中,所述潜在语义索引模型是对由描述同一视频类别的视频节目的描述文档所构建成的索引矩阵进行奇异值分解而获得的;

根据所述潜在语义索引模型,计算所述索引矩阵的每一列向量与所述查询向量的余弦相似度;

对计算获得的余弦相似度进行从大到小的排序,并选取排序号属于排序区间的余弦相似度的列向量对应的视频节目提供给所述用户;

其中,由描述视频节目的描述文档构建成索引矩阵的过程包括:将第i个关键词在第j个视频节目的描述文档中出现的词频作为索引矩阵的第j列的第i个元素的数值;

构建所述描述词条的查询向量的过程包括:设置所述查询向量的第i个元素代表的关键词与所述索引矩阵的第i行元素代表的关键词相同,并将第i个元素对应的关键词在所述描述词条中出现的词频作为所述查询向量的第i个元素的数值;其中,所述查询向量为列向量。

2.如权利要求1所述的视频节目的搜索方法,其特征在于,由描述同一视频类别的视频节目的描述文档构建成索引矩阵的过程,具体为:

对于数据库存储的描述同一视频类别的视频节目的所有描述文档,根据标准词条格式,对所述所有描述文档包含的词条进行格式调整;其中,所述数据库存储有多种视频类别的描述文档,一个描述文档描述一个视频节目,不同的描述文档描述的视频节目互不相同;

调用分词工具;

利用所述分词工具对格式调整后的所述所有描述文档的词条进行分词,获得第一词语集;

根据TF-IDF算法从所述第一词语集中提取关键词;

根据所提取的每一个关键词在每一个描述文档中出现的词频,构建索引矩阵;其中,所述索引矩阵的行顺序是根据关键词在所述所有描述文档出现的总词频进行由高到低的排列,所述索引矩阵的列顺序根据关键词在每一个描述文档中出现的词频进行由高到低的排列。

3.如权利要求1所述的视频节目的搜索方法,其特征在于,所述构建所述描述词条的查询向量,具体为:

根据标准词条格式,对所述描述词条进行格式调整;

调用分词工具;

利用所述分词工具对格式调整后的所述描述词条进行分词,获得第二词语集;

根据TF-IDF算法从所述第二词语集中提取关键词;

根据所提取的每一个关键词在所述描述词条中出现的词频,构建所述描述词条的查询向量。

4.如权利要求2所述的视频节目的搜索方法,其特征在于,所述索引矩阵为H,则对所述索引矩阵进行奇异值分解所获得的所述潜在语义索引模型为:H=T*S*DT;其中,T为正交矩阵,矩阵T的每一列是所述索引矩阵H的左奇异向量;S为对角矩阵,矩阵S的对角线元素是所述索引矩阵H的奇异值;D为正交矩阵,矩阵D的每一列为所述索引矩阵H的右奇异向量;所述查询向量为Q;

所述根据所述潜在语义索引模型,计算所述索引矩阵的每一列向量与所述查询向量的余弦相似度,具体为:

选取TK、SK和DK矩阵,修订所述潜在语义索引模型为HK=TK*SK*DKT;其中,TK为由矩阵T的前K列形成的矩阵,SK为由矩阵S的前K个对角线元素形成的对角矩阵,DK为由矩阵D的前K列形成的矩阵;K的数值大于所述排序区间包含的最大排序号;

对于修订后的所述潜在语义索引模型的索引矩阵HK,计算所述查询向量的转置矩阵QT与所述矩阵TK相乘所得的行向量和所述矩阵DK与所述矩阵SK相乘所得矩阵的第j行向量的两行向量之间的余弦相似度,作为所述索引矩阵HK的第j列向量与所述查询向量Q的余弦相似度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611019485.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top