[发明专利]一种网页搜索设备和方法有效
申请号: | 201210395010.0 | 申请日: | 2012-10-17 |
公开(公告)号: | CN102937975A | 公开(公告)日: | 2013-02-20 |
发明(设计)人: | 张栋 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙) 11391 | 代理人: | 范晓斌;康正德 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 搜索 设备 方法 | ||
技术领域
本发明涉及计算机领域,更具体地,涉及一种网页搜索设备和方法。
背景技术
计算机用户可以通过网页浏览器来访问互联网网页。随着互联网的高速发展,在互联网上提供的信息数量也日益庞大,用户很难记住提供信息网站的具体地址,因而常常依赖于搜索网站来查询网络上的相关信息。
搜索网站利用搜索引擎来从互联网中提取各个网站或网页的信息(以网页文字为主),建立起数据库。当用户在搜索网站上进行查询时,搜索引擎能检索与用户查询条件相匹配的记录,按一定的排列顺序返回查询结果。
然而,现有的搜索网站在提供搜索服务时,其通常要求用户在搜索界面中输入具体的查询内容即搜索词。然后,当用户通过敲击键盘上的回车或者点击搜索界面上的搜索图标来发出搜索请求时,搜索引擎会根据用户输入的搜索词进行检索,并向用户返回搜索结果。如果用户没有输入搜索词,搜索网站则会不进行任何搜索操作,有时还会提醒用户应当输入搜索词。
本申请的发明人发现,有些时候,用户未在搜索网站上输入搜索词并不是因为忘记输入,而是如同用户在浏览各种信息网站一样,并没有明确的查询目的,而是希望搜索引擎可以向用户提供感兴趣的搜索结果。
现有的搜索网站没有充分考虑用户没有明确输入搜索词的原因,而是简单地认为是用户忘记输入搜索词了,因此没有充分考虑到用户期望搜索网站能够提供自己最感兴趣的搜索结果而不用任何输入的潜在需求。
发明内容
本发明的一个目的是提供一种克服上述缺陷或者至少部分地缓解上述缺陷的一种网页搜索设备和方法。
为了实现上述至少一个目的,按照本发明的一个方面,提供了一种网页搜索设备,该网页搜索设备包括:
术语提取器,其配置成从网页中提取一个或多个术语;
搜索器,其配置成在用户未输入搜索词时将一个或者多个术语中的至少一个术语作为搜索词向搜索引擎发出搜索请求,并向用户返回搜索结果。
在一个实施例中,网页搜索设备还包括网址获取器,其配置成获取浏览器处的一个或多个用户关注网址;其中,术语提取器从与一个或多个用户关注网址相对应的网页中提取术语。
可选地,术语提取器还配置成计算一个或多个术语的重要度值,重要度值用于标识术语在网页中的重要度。
可选地,术语的重要度值根据术语分别在各个对应网页的重要度值以及各个对应网页的网页权重值加权计算得到。
可选地,网页权重值根据用户浏览对应网页的顺序来确定,越新浏览的网页的权重值越高。
可选地,搜索器设置成基于术语的重要度值选择至少一个术语作为搜索词,例如,搜索器设置成将重要度值最高的术语选做搜索词。
可选地,搜索器设置成:当用户未输入搜索词后对返回的搜索结果无浏览操作时,则在用户后续未输入搜索词进行搜索时,将之前没有作为搜索词使用过的术语作为备选的搜索词。
可选地,网址获取器配置成从下列网址中获取用户关注网址:
浏览器中存储的网页浏览历史;
浏览器的本地收藏夹中存储的网页的网址;和/或
用户的网络收藏夹中存储的网页的网址。
可选地,网址获取器配置成排除与呈现搜索结果的网页相对应的网址作为用户关注网址。
在一个实施例中,网页搜索设备还包括术语列表生成器,其配置成生成包含所提取的各术语的术语列表。
在一个实施例中,网页搜索设备还包括术语更新器,其配置成更新用户关注网址;以及术语提取器从与更新的用户关注网址相对应的网页中提取术语。
可选地,搜索器配置成在用户输入搜索词时,根据用户输入的搜索词向搜索引擎发出搜索请求,并向用户返回搜索结果。
按照本发明的另一方面,提供了一种网页搜索方法,包括:
术语提取步骤,用于从网页中提取一个或多个术语;
搜索步骤,用于在用户未输入搜索词时将一个或者多个术语中的至少一个术语作为搜索词向搜索引擎发出搜索请求,并向用户返回搜索结果。
在一个实施例中,网页搜索方法还包括网址获取步骤,用于获取浏览器处的一个或多个用户关注网址;其中,在术语提取步骤中,从与一个或多个用户关注网址相对应的网页中提取术语。
可选地,在术语提取步骤中还计算一个或多个术语的重要度值,重要度值用于标识术语在网页中的重要度。
可选地,术语的重要度值根据术语分别在各个对应网页的重要度值以及各个对应网页的网页权重值加权计算得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210395010.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:并行化分布式互联网数据抓取方法及其系统
- 下一篇:一种视听字幕制作系统及方法