[发明专利]一种基于搜索引擎的搜索结果排序方法及装置有效
申请号: | 200710187276.5 | 申请日: | 2007-11-15 |
公开(公告)号: | CN101158971A | 公开(公告)日: | 2008-04-09 |
发明(设计)人: | 刘汉洲 | 申请(专利权)人: | 深圳市迅雷网络技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 刘松 |
地址: | 518057广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 搜索引擎 搜索 结果 排序 方法 装置 | ||
技术领域
本发明涉及搜索引擎领域,特别是涉及一种基于搜索引擎的搜索结果排序方法及装置。
背景技术
随着搜索引擎技术的不断发展与信息处理技术的进步,人们对搜索引擎的需求也越来越广泛,搜索引擎的种类也呈现多样化发展。目前,主流的搜索引擎分为:全文搜索引擎、目录搜索引擎和元搜索引擎。近期,垂直搜索引擎也逐渐进入了人们的视野。
在搜索引擎领域,评价一个搜索引擎好坏的重要标准就是能否让用户尽快找到所需的信息,即与用户搜索主题相关的各种信息。
近年来,各大搜索引擎在搜索结果的相关性排序上均做了优化。所谓搜索结果的相关性就是指用户搜索词和页面的相关程度。通常,相关性是搜索引擎进行排序的一个重要依据。计算页面相关性的主要方法有google的PageRank、Bharat的HillTop、百度的超链分析等。它们的基本原理就是根据网页的引用情况进行排序。
但是由于在中文搜索引擎中存在分词的问题,词典是以搜索词作为查询词的搜索引擎的基础。词典的好坏在一定程度上决定着搜索结果排序的效果。词典过小,会导致过多的无关信息的出现;词典过大,有时会导致部分词搜索结果的主题过少等问题出现。因此如何确定词典,增加新的扩充词典集,使搜索引擎的结果更加准确、更加人性化就随之成为一个备受关注的问题。
发明内容
本发明实施例提供一种基于搜索引擎的搜索结果排序方法及装置,使排序结果更加贴近用户的需求。
本发明实施例的一种基于搜索引擎的搜索结果排序方法,包括下列步骤:对用户输入的搜索词进行分词处理;以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重;确定所述搜索词在各待排序网络资源中的总权重;以及按照总权重对所述各待排序的网络资源进行排序,并呈现给用户。
本发明实施例的一种基于搜索引擎的搜索结果排序装置,包括:分词单元,用于对用户输入的搜索词进行分词处理;关键词权重确定单元,用于以分词处理所得分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重;总权重确定单元,用于确定所述搜索词在各待排序网络资源中的总权重;排序单元,用于按照总权重对所述各待排序的网络资源进行排序;呈现单元,用于向用户呈现排序结果。
综上所述,本发明实施例中对用户输入的搜索词进行分词处理;以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源中的关键词权重,并确定所述搜索词在各待排序网络资源中的总权重。由于总权重中考虑了搜索词与关键词的匹配等情况,所以按照总权重对所述各待排序的网络资源进行排序并呈现给用户,可更加贴近用户的需求。
附图说明
图1为本发明实施例的方法步骤流程图;
图2为本发明实施例的装置结构示意图;
图3为本发明实施例的装置优化结构示意图;
图4为本发明实施例的索引示意图;
图5为本发明实施例中确定待排序网络资源的示意图;
图6为本发明实施例中查询分词权重的示意图。
具体实施方式
为了使排序结果更加贴近用户的需求,本发明实施例提供了一种基于搜索引擎的搜索结果排序方法及装置,以下分别简要概述。
本发明实施例提供的一种基于搜索引擎的搜索结果排序方法,在进行了一些预先设置,用户输入搜索词,并且确定了待排序网络资源之后,参见图1所示,执行下列主要步骤:
S1、对用户输入的搜索词进行分词处理(本步骤也可在确定待排序网络资源之前执行)。
S2、以分词处理所得的分词分别在关键词索引中进行查找,以确定所述搜索词在各待排序网络资源(包括但不限于网页资源及下载资源,以下不再赘述)中的关键词权重。
S3、确定所述搜索词在各待排序网络资源中的总权重。
S4、按照总权重对所述各待排序的网络资源进行排序,并呈现给用户。
在用户输入搜索词进行搜索之前,预先的设置步骤,具体包括:
定制关键词词典的步骤:以词和词的属性作为基本结构,定制的关键词词典中包括各有效词和每一有效词对应的属性,以及各无效词和每一无效词对应的属性。所述无效词的集合与有效词的集合互为互斥关系,并且一个无效词包含的字符覆盖一个有效词包含的字符。所述词的属性以字符型数字表示,每一位字符分别表示所述词的一种属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市迅雷网络技术有限公司,未经深圳市迅雷网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710187276.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改进的彩钢外墙保温装饰墙板
- 下一篇:一种移动脚手架纵、横向支撑装置