[发明专利]一种纵向搜索引擎的构建方法及装置有效
申请号: | 201710367823.1 | 申请日: | 2017-05-23 |
公开(公告)号: | CN107291817B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 阮勇辉;俞侃;王丽君;詹玲;王方 | 申请(专利权)人: | 华中科技大学文华学院 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/955 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 430074 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纵向 搜索引擎 构建 方法 装置 | ||
1.一种纵向搜索引擎的构建方法,其特征在于,所述方法包括:
获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;其中,所述搜索数据还包括:若干个关键词组,每一个所述关键词组对应每一个所述网页链接组;
确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;
在所述若干个网页链接中,将每一个相同的所述网页链接在对应的网页链接组中的第一权重值进行相加,作为合并后所述相同的所述网页链接的第二权重值;
依据每一个所述网页链接的所述第二权重值获得每一组所述网页链 接组的第三权重值;
依据所述第三权重值将若干个所述网页链接组从大到小进行排序;
将排序后所述的若干个所述网页链接组按照排序顺序进行输出。
2.如权利要求1所述的方法,其特征在于:
所述若干个网页链接组是三组,包括第一网页链接组,第二网页链接组,第三网页链接组;
所述第一网页链接组中所述若干个网页链接的个数是n1;
所述第二网页链接组中所述若干个网页链接的个数是n2;
所述第三网页链接组中所述若干个网页链接的个数是n3;
所述确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值包括:
对于所述第一网页链接组中,每一个网页链接的第一权重值是1/n1;
对于所述第二网页链接组中,每一个网页链接的第一权重值是1/n2;
对于所述第三网页链接组中,每一个网页链接的第一权重值是1/n3;
其中,所述n1、所述n2和所述n3均为正整数。
3.如权利要求2所述的方法,其特征在于:
在所述若干个网页链接中,将每一个不同的所述网页链接在对应的网页链接组中的第一权重,作为所述不同的所述网页链接的第二权重。
4.如权利要求3所述的方法,其特征在于,所述依据每一个所述网页链接的所述第二权重值获得每一组所述网页链 接组的第三权重值包括:
分别将每一个所述网页链接组中所述若干个所述网页链接的第二权重值相加,作为所述网页链接组的第三权重值。
5.一种纵向搜索引擎的构建装置,其特征在于,所述装置包括:
搜索数据获取模块,用于获取用户浏览网页时的搜索数据,所述搜索数据至少包括:若干个网页链接组,每一个所述网页链接组包括若干个网页链接;其中,所述搜索数据还包括:若干个关键词组,每一个所述关键词组对应每一个所述网页链接组;
第一权重值确定模块,用于确定所述每一个所述网页链接组中所述若干个网页链接的第一权重值;
第二权重值确定模块,用于在所述若干个网页链接中,将每一个相同的所述网页链接在对应的网页链接组中的第一权重值进行相加,作为合并后所述相同的所述网页链接的第二权重值;
第三权重值确定模块,用于依据每一个所述网页链接的所述第二权重值获得每一组所述网页链接组的第三权重值;
排序模块,依据所述第三权重值将若干个所述网页链接组从大到小进行排序。
6.如权利要求5所述的装置,其特征在于,还包括:
输出模块,用于将排序后所述的若干个所述网页链接组按照排序顺序进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学文华学院,未经华中科技大学文华学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710367823.1/1.html,转载请声明来源钻瓜专利网。