[发明专利]基于聚类和查询行为的检索结果排序方法有效

专利信息
申请号: 201410122930.4 申请日: 2014-03-28
公开(公告)号: CN103902694B 公开(公告)日: 2017-04-12
发明(设计)人: 杨静;刘宁;张健沛 申请(专利权)人: 哈尔滨工程大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 150001 黑龙江省哈尔滨市南岗区*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 查询 行为 检索 结果 排序 方法
【说明书】:

技术领域

发明涉及一种信息检索领域的方法,特别是涉及一种基于聚类和查询行为的检索结果排序方法。

背景技术

搜索引擎在用户输入一个查询后,返回一个“相关”结果的列表,然而这个检索结果列表往往不能让用户满意。一方面由于用户查询的不确定性,例如查询词有多义性,存在多种解释,搜索引擎无法确定用户的需求;另一方面,对于搜索引擎返回的大量结果,用户通常只选择浏览Top10的检索结果,由于检索结果没有进行合理的总结与组织,而仅仅是简单的罗列,Top10的检索结果可能是不全面的,因此用户获取到的信息可能是不全面的。

目前有一些研究通过采用对检索结果聚类来解决上面所阐述的问题,一方面对于有歧义的查询,通过检索结果聚类,可以按照不同语义将检索结果聚成不同类别;另一方面,检索结果聚类能够对检索结果进行全面的分析处理,可以给出一个全面的关于被查询对象的介绍。但是现有的检索结果聚类排序方法大多是对文档的查询相关度与文档间的相似性的线性组合优化问题进行求解。这类相对静态的方法是从系统的角度对用户意图进行挖掘,无法真正把握用户的查询意图。

发明内容

本发明的目的在于提供一种基于聚类和查询行为的检索结果排序方法,根据用户点击文档的反馈信息进行在线学习,可以动态的调整类别的排列顺序以及类别内文档的选择,能够更好地满足用户的多样化需求。

实现本发明目的的技术方案:

一种基于聚类和查询行为的检索结果排序方法,其特征在于:

步骤1:计算文档与查询的相关度Sim(q,di),并根据相关度选取候选文档集合;

步骤2:对候选文档集合进行聚类分析,计算每个聚类与查询的相关度Sim(q,Clui);

步骤3:根据步骤1中获得的文档的相关度Sim(q,di)和步骤2中获得的文档所在聚类的相关度Sim(q,Clui),计算文档的排序Rank(di);

步骤4:根据用户点击文档的反馈信息更新文档的相关度Sim(q,di)和聚类的相关度Sim(q,Clui):

步骤5:根据步骤4中更新的文档的相关度Sim(q,di)和文档所在聚类的相关度Sim(q,Clui),更新计算文档的Rank(di)。

步骤4中,如果用户点击文档,则文档的相关度Sim(q,di)=Sim(q,di)+β,文档所在聚类的Sim(q,Clui)=Sim(q,Clui)+β;如果用户没有点击文档,文档的相关度Sim(q,di)=Sim(q,di)-β,文档所在聚类的Sim(q,Clui)=Sim(q,Clui)-β;式中β为参数,0<β<1。

通过如下公式计算文档的排序Rank(di):

Rank(di)=λ*Sim(q,di)+(1-λ)Sim(q,Clui)

式中,λ=0.7。

本发明的有益效果:

本发明根据文档的相关度Sim(q,di)和文档所在聚类的相关度Sim(q,Clui),计算文档的排序Rank(di);对于有歧义的查询,能够对检索结果进行全面的分析处理,可以给出一个全面的关于被查询对象的介绍。

本发明根据用户点击文档的反馈信息更新文档的相关度Sim(q,di)和聚类的相关度Sim(q,Clui),继而更新文档的排序Rank(di),能够根据用户的点击行为,挖掘用户查询所蕴含的各种潜在意图,可以动态的调整文档的排列顺序,从而更好地满足了用户的多样化需求。

附图说明

图1为本发明基于聚类和查询行为的检索结果排序方法的流程图。

具体实施方式

下面结合附图和具体实施方式对本发明的实施过程作进一步详细的描述。

参照图1,本发明提出了一种基于聚类和查询行为的检索结果排序方法,该方法包括下述几个步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410122930.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top