[发明专利]一种搜索方法、装置及系统无效
申请号: | 201210039526.1 | 申请日: | 2012-02-21 |
公开(公告)号: | CN103257975A | 公开(公告)日: | 2013-08-21 |
发明(设计)人: | 高得恩;高一波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 方法 装置 系统 | ||
技术领域
本发明属于网络搜索领域,尤其涉及一种搜索方法、装置及系统。
背景技术
现有的搜索引擎大多是通用的搜索引擎,其抓取所有领域类别的网页,因此在用户给出搜索条件之后,其相应的搜索结果涉及范围较广,且大多直接以网页链接的形式提供给用户。
而在实际的搜索行为中,用户往往有一些特定信息的搜索需求,例如,对于准备攻读研究生的学生而言,在其准备过程中,需要大量查阅相关研究领域的教授的个人信息,以确定报考对象;对于科研人员来说,需要经常查找与其研究方向相符的科研人才信息,以便进行学术交流。仅以搜索科研人才信息为例,假如在现有的搜索引擎中搜索“信号处理”,试图查找到信号处理领域的专业科研人才,然而,现有的搜索引擎给出的结果大多为有关“信号处理”的名词解释、专业书籍等,有关该领域的科研人才信息却很难在排序靠前的搜索结果中进行显示,即使给出了相符的搜索结果,也需要用户自己打开网页进一步定位所需要的信息,搜索结果无针对性且不直观。
发明内容
本发明实施例的目的在于提供一种搜索方法,旨在解决现有的搜索引擎当遇到用户的特定信息搜索需求时,搜索结果无针对性且不直观的问题。
本发明实施例是这样实现的,一种搜索方法,所述方法包括:
在预设类型的网站中获取特定信息类别的网页数据,并将所述网页数据转化为结构化数据后保存;
根据用户提供的搜索条件,展示与所述搜索条件匹配的结构化数据。
本发明实施例的另一目的在于提供一种搜索装置,所述装置包括:
搜索数据库,用于在预设类型的网站中获取特定信息类别的网页数据,并将所述网页数据转化为结构化数据后保存;
展示模块,用于根据用户提供的搜索条件,展示与所述搜索条件匹配的结构化数据。
本发明实施例的另一目的在于提供一种搜索系统,所述系统包括如上所述的搜索装置。
本发明实施例通过在预设类型的网站中获取特定信息类别的网页数据,并将获取到的网页数据结构化并以索引形式存储,从而在用户进行搜索的时候,能够根据用户提供的搜索条件直接展示与该搜索条件相匹配的、特定信息类别的结构化数据,直观、有序且有针对性地为用户提供特定信息搜索服务。
附图说明
图1是本发明第一实施例提供的搜索方法的实现流程图;
图2是本发明第二实施例提供的获取特定信息类别网页数据的实现流程图;
图3是本发明第三实施例提供的获取特定信息类别网页数据的较佳实施方式的实现流程图;
图4是本发明第三实施例提供的DOM-tree示例图;
图5是本发明第四实施例提供的搜索装置的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例通过在预设类型的网站中获取特定信息类别的网页数据,并将获取到的网页数据结构化并以索引形式存储,从而在用户进行搜索的时候,能够根据用户提供的搜索条件直接展示与该搜索条件相匹配的、特定信息类别的结构化数据,直观、有序且有针对性地为用户提供特定信息搜索服务。
需要说明的是,在以下所述的本发明实施例中,为了便于说明,均以科研人才信息的搜索需求为例进行说明,但本发明实施例的应用范围包括但不限于科研人才信息搜索,也可以是招聘信息搜索、商品信息搜索等,在此不作限定。
图1示出了本发明第一实施例提供的搜索方法的实现流程,详述如下:
在步骤S101中,在预设类型的网站中获取特定信息类别的网页数据,并将所述网页数据转化为结构化数据后保存。
在本发明实施例中,由于针对的是用户有关特定信息类别的搜索需求,对于搜索结果与用户搜索意向的贴合度要求较高,因此,针对某一特定信息类别建立用于匹配搜索结果的结构化数据索引,首先要将进行网页抓取的网站范围进行限定。例如,针对科研人才信息,预设类型的网站为各高校及各科研机构网站,且特定信息类别的网页数据自然为此类网站中的教职员或者研究人员个人信息。
在预设类型的网站中获取特定信息类别的网页数据的具体实现过程将在后述实施例中详细说明,再此不赘述。
当获取到需要的网页数据之后,通过将获取到的网页数据结构化并以索引方式存入相应的数据库,即完成了对该搜索引擎索引系统的构建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210039526.1/2.html,转载请声明来源钻瓜专利网。