[发明专利]一种基于查询语义和点击流数据的查询建议方法无效
申请号: | 201110172766.4 | 申请日: | 2011-06-24 |
公开(公告)号: | CN102253982A | 公开(公告)日: | 2011-11-23 |
发明(设计)人: | 彭学平;牛振东;黄胜 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于查询语义和点击流数据的查询建议方法,包括以下步骤:一、对收集的查询日志数据进行预处理;二、对用户输入的查询数据进行分词、过滤停用词的预处理;三、将用户查询数据串与查询日志库中日志信息逐条进行相似度计算;四、基于知网中的词概念相关度计算方法,将用户查询数据串与查询日志库中日志信息逐条进行语义相关度计算;五、将相似度和语义相关度进行融合,计算用户查询数据串与查询日志库中每条日志信息的查询语义相关度;六、按照步骤五中的相关度由大到小,取出Top-N推荐给用户。本发明可以有效的消除查询歧义,并对输入错误进行提醒,提高信息检索系统的易用性和交互能力。 | ||
搜索关键词: | 一种 基于 查询 语义 点击 数据 建议 方法 | ||
【主权项】:
一种基于查询语义和点击流数据的查询建议方法,包括以下步骤:一、对收集的查询日志数据进行预处理,去掉非中文查询串、乱码数据及无意义的符号,形成规范的查询日志库;二、对用户输入的查询数据进行分词、过滤停用词的预处理,形成包含多个关键词的查询数据串;三、将用户查询数据串与查询日志库中日志信息逐条进行相似度计算;四、基于知网中的词概念相关度计算方法,将用户查询数据串与查询日志库中日志信息逐条进行语义相关度计算;五、将步骤三和步骤四计算出的相似度和语义相关度进行融合,计算用户查询数据串与查询日志库中每条日志信息的查询语义相关度;六、按照步骤五中的相关度由大到小,取出Top N推荐给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110172766.4/,转载请声明来源钻瓜专利网。