[发明专利]一种基于位置的关键字查询推荐方法及系统在审
| 申请号: | 201611160518.7 | 申请日: | 2016-12-15 |
| 公开(公告)号: | CN106777112A | 公开(公告)日: | 2017-05-31 |
| 发明(设计)人: | 吴定明;齐书尧;尼克斯·孟每恩;贾晋 | 申请(专利权)人: | 深圳大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 深圳市恒申知识产权事务所(普通合伙)44312 | 代理人: | 王利彬 |
| 地址: | 518000 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 位置 关键字 查询 推荐 方法 系统 | ||
技术领域
本发明属于信息检索领域,尤其涉及一种基于位置的关键字查询推荐方法及系统。
背景技术
在信息检索中,关键字查询推荐是指用户在提交查询关键字时,系统为用户自动推荐若干与该查询关键字相关的关键字供用户选择,这若干被系统推荐的关键字能够快速查找和定位用户所需要检索的目标,从而满足用户的信息检索需求。
目前,在信息检索领域主要采用以下三种查询推荐方法来为用户进行关键字查询推荐。
随机漫步方法:基于随机漫步过程的推荐模型是比较常用的一种方法,这种方法利用查询系统日志的信息建立一个查询-数据二部图或者查询流图,在图模型上应用不同种类的随机漫步过程计算出推荐的查询。
机器学习方法:基于机器学习的推荐模型方法通过历史数据训练一个模型,采用概率的方法计算待推荐的查询。
聚类方法:采用聚类思想的推荐方法试图找出与原查询具有相同特征的查询作为推荐。
现有的查询推荐方法只能满足查询关键字语义上相关,而忽略了用户的查询位置上相关,无法保证推荐的查询所获取的结果在用户的查询位置附近,因此很难给予用户期望的查询结果,推荐的查询结果质量很低。
发明内容
本发明提供了一种基于位置的关键字查询推荐方法及系统,旨在解决现有的关键字查询推荐的查询结果质量低的问题。
为解决上述技术问题,本发明了一种基于位置的关键字查询推荐方法,所述方法包括下述步骤:
步骤1:基于关键字查询日志建立关键字与文档之间的映射关系,并根据所述映射关系、关键字与文档之间的边的权重绘制关键字-文档图,所述边的权重是基于与关键字具有映射关系的文档的被点击次数进行预设标准化计算得到的;
步骤2:接收用户提交的查询关键字,并基于所述查询关键字的查询位置、所述关键字-文档图中与所述查询关键字相关的文档的空间位置,对所述关键字-文档图中边的权重进行调整得到调整后的边的权重;
步骤3:按照预设的分组规则将所述关键字-文档图中的关键字和文档分别进行分组,基于所述查询关键字、所述调整后的边的权重,结合随机漫步过程对所述分组进行计算,得到符合预设条件的关键字,并将所述关键字推荐给所述用户。
进一步地,所述步骤2包括:
接收用户提交的查询关键字,所述查询关键字信息包含查询关键字kq和查询位置λq;
对所述查询关键字kq到与其具有映射关系的文档dj的边e的权重进行调整,调整公式为:
其中,ω(e)表示关键字-文档图中边e的权重初始值,dist(λq,dj.λ)表示所述查询位置λq和所述文档dj的空间位置之间的欧氏距离,β∈[0,1]是用来平衡调整前的所述权重和所述调整后的权重的参数;
对所述文档dj到所述查询关键字kq的边e'的权重进行调整,调整公式为:
其中,D(kq)表示所述关键字-文档图中与所述查询关键字kq相连的文档的集合,mindist(λq,D(kq))表示所述查询位置λq与所述D(kq)中最近的文档的空间位置之间的欧氏距离,ω(e')表示关键字-文档图中边e'的权重初始值,β∈[0,1]是用来平衡调整前的所述权重和所述调整后的权重的参数。
进一步地,所述步骤3包括:
步骤A:将所述关键字-文档图中的关键字和文档分别按照预设分组规则进行分组,得到关键字分组的集合pk={PjK},及文档分组的集合pD={PiD},其中,PjK表示第j个关键字分组,PiD表示第i个文档分组;
建立所述关键字分组PjK与所述文档分组PiD之间的映射关系,所述映射关系按照如下方式建立:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611160518.7/2.html,转载请声明来源钻瓜专利网。





