[发明专利]一种纵向搜索引擎的构建方法及装置有效
申请号: | 201710367823.1 | 申请日: | 2017-05-23 |
公开(公告)号: | CN107291817B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 阮勇辉;俞侃;王丽君;詹玲;王方 | 申请(专利权)人: | 华中科技大学文华学院 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/955 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 430074 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纵向 搜索引擎 构建 方法 装置 | ||
本发明公开一种纵向搜索引擎的构建方法及装置,属于互联网技术领域,该方法包括:获取用户浏览网页时的搜索数据,搜索数据至少包括:若干个网页链接组,每一个网页链接组包括若干个网页链接;确定每一个网页链接组中若干个网页链接的第一权重值;将每一个网页链接组中相同的网页链接进行合并,以确定合并后的每一个网页链接的第二权重值;依据每一个所述网页链接的第二权重值获得每一组网页连接组的第三权重值;依据第三权重值将若干个网页链接组从大到小进行排序。本发明提供的方法提高了搜索效率,具有提升用户搜索体验的技术效果。
技术领域
本发明属于互联网技术领域,特别涉及一种纵向搜索引擎的构建方法及装置。
背景技术
现有的网页搜索引擎核心,如同谷歌公司使用的page-rank算法,其是先找到与搜索关键字相关的所有网页,再对结果集进行排序,排序依据是网页之间的引用。
然而,使用上述现有的搜索引擎,当用户在搜索引擎中输入若干关键字时,搜索引擎返回的结果列表是对网页进行排序的结果。
这样就使得用户在具体的搜索过程中,是通过在结果列表中依次点击网页链接来完成搜索过程,具有搜索效率低的技术缺陷。
发明内容
本发明提供一种纵向搜索引擎的构建方法及装置,用以解决现有技术中由于用户具体的搜索过程,是通过在结果列表中依次点击网页链接来完成搜索过程,而导致的具有搜索效率低的技术缺陷。
依据本发明实施例的一个方面,本发明实施例提供了一种纵向搜索引擎的构建方法,包括:
获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;
确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;
将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值;
依据每一个所述网页链接的所述第二权重值获得每一组所述网页连接组的第三权重值;
依据所述第三权重值将若干个所述网页链接组从大到小进行排序。
进一步地,所述方法还包括:将排序后所述的若干个所述网页链接组按照排序顺序进行输出。
进一步地,所述方法还包括:所述搜索数据还包括若干个关键词组,每一个所述关键词组对应每一个所述网页链接组。
进一步地,所述方法还包括:所述若干个网页链接组是三组,包括第一网页链接组,第二网页链接组,第三网页链接组;
所述第一网页链接组中所述若干个网页链接的个数是n1;
所述第二网页链接组中所述若干个网页链接的个数是n2;
所述第三网页链接组中所述若干个网页链接的个数是n3;
所述确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值包括:
对于所述第一网页链接组中,每一个网页链接的第一权重值是1/n1;
对于所述第二网页链接组中,每一个网页链接的第一权重值是1/n2;
对于所述第三网页链接组中,每一个网页链接的第一权重值是1/n3;
其中,所述n1、所述n2和所述n3均为正整数。
进一步地,所述方法还包括:所述将所述每一个所述网页链接组中相同的网页链接进行合并,以确定合并后的每一个所述网页链接的第二权重值包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学文华学院,未经华中科技大学文华学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710367823.1/2.html,转载请声明来源钻瓜专利网。