[发明专利]视频搜索方法及系统有效
申请号: | 201010600040.1 | 申请日: | 2010-12-13 |
公开(公告)号: | CN102063476A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | 陈海坤 | 申请(专利权)人: | 百度时代网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100080 北京市海淀区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 搜索 方法 系统 | ||
技术领域
本发明涉及搜索引擎技术,尤其涉及一种视频搜索方法及系统。
背景技术
随着互联网上信息的飞速增长,网络上充斥了越来越多的冗余信息,而对于在网络上搜寻自己所需要信息的互联网用户而言,面对这些漫无边际的信息无疑像大海捞针。搜索引擎的出现无疑在一定程度上为用户的搜索需求带来了很大便利。搜索引擎是一种在网络上应用的软件系统,其以一定的策略在网络上搜集和发现信息,并在对信息进行处理和组织后,为用户提供互联网上的信息搜索服务。通常,这种软件系统提供一个网页界面,让用户在客户端通过浏览器软件提交搜索词,然后很快返回一个可能和用户输入的搜索内容相关的信息列表。这个列表通常会包括上万个条目,每个条目代表一篇搜索到的相关网页。
过去十几年以来,相应地,众多的互联网搜索引擎及对应的网站应运而生,这中间的佼佼者包括百度公司的百度搜索(www.baidu.com)和谷歌公司的谷歌搜索(www.google.cn)。
随着网络技术的不断发展,用户对搜索引擎的要求已经不再满足于只是对文本的搜索,很多用户还希望可以通过搜索引擎对网络视频进行搜索。然而,在目前的视频搜索中,存在以下几个问题:
首先,用户在客户端通过浏览器软件提交搜索词后,其是通过该搜索词在视频标题中进行搜索,并返回搜索结果,即是:只能返回标题文本中包含所述搜索词的视频,例如:如图1所示,当用户在客户端通过浏览器软件提交“恐怖片”为搜索词后,通过搜索引擎的搜索,返回只有标题文本中包含“恐怖片”的视频,搜索形式单一;
其次,在现有技术中,用户在客户端通过浏览器软件提交搜索词后,搜索引擎会将各大视频网站的不同上传者的不同版本进行搜索并返回给用户,并不是以作品为单位去组织搜索结果,这样,会导致返回的搜索结果重复地、无序地出现,影响视觉。
另外,在现有技术中,对于视频的搜索结果,一般地只是展示出视频链接和视频图片,展现形式较为单一,不能使用户全方位的了解搜索结果的质量。
发明内容
本发明的目的在于提供一种改进的视频搜索方法,其不仅可以在标题文本信息中搜索视频,还可在视频作品信息中搜索视频,同时,本发明的视频搜索方法还可无重复地、有序地将视频搜索结果展示给用户。
本发明的目的还在于提供一种实现上述视频搜索方法的视频搜索系统。
为实现上述发明目的之一,本发明的一种视频搜索方法,包括以下步骤:
作品信息建构步骤:获取作品信息,并建立作品信息数据库;
视频对象分类步骤:将视频对象和作品ID进行映射;
索引生成步骤:将所述作品信息数据库中的作品信息生成索引;
接收搜索词步骤:接收搜索词;
搜索步骤:将所述搜索词在所述索引中进行搜索,并得到搜索结果;
搜索结果输出步骤:输出所述搜索结果。
作为本发明的进一步改进,所述作品信息建构步骤包括:
获取作品信息步骤:获取作品信息;
保存作品信息步骤:将所述作品信息存入所述作品信息数据库。
作为本发明的进一步改进,在所述获取作品信息步骤中是通过SPIDER定向从网络抓取所述作品信息。
作为本发明的进一步改进,所述视频对象分类步骤包括:
识别视频对象类型步骤:识别一个视频对象的类型;
提取作品名步骤:提取与所述视频对象对应的作品名;
匹配步骤:将所述视频对象通过所述作品名与所述作品信息数据库中的视频进行匹配,获取作品ID,完成所述视频对象与所述作品ID的映射。
作为本发明的进一步改进,一个所述作品ID可映射到多个所述视频对象。
作为本发明的进一步改进,所述接收搜索词步骤包括:
接收用户输入的搜索词;
判断所述搜索词是否属于概括词;
若该搜索词为概括词,则进入搜索步骤。
作为本发明的进一步改进,所述接收搜索词步骤还包括:
若该搜索词为未概括词,则直接搜索视频对象。
作为本发明的进一步改进,所述搜索步骤包括:
去重步骤:将所述作品ID重复的视频对象统一为一部视频;
排序步骤:根据所述作品ID的属性进行排序。
作为本发明的进一步改进,所述作品ID的属性包括:所述作品ID的类型、时间、用户欢迎程度。
作为本发明的进一步改进,所述排序步骤还包括:
判断搜索词中是否包括含有时间定义的关键字;
若含有时间定义的关键字,则按照时间维度进行排序。
作为本发明的进一步改进,所述排序步骤还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度时代网络技术(北京)有限公司,未经百度时代网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010600040.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:模块化构造的变流器系统
- 下一篇:无级变速器的控制装置