[发明专利]一种挖掘具有相似需求的查询的方法及装置有效
申请号: | 201110379429.2 | 申请日: | 2011-11-24 |
公开(公告)号: | CN103136223B | 公开(公告)日: | 2016-11-16 |
发明(设计)人: | 黄际洲 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 挖掘 具有 相似 需求 查询 方法 装置 | ||
【技术领域】
本发明涉及自然语言处理技术,特别涉及一种挖掘具有相似需求的查询的方法及装置。
【背景技术】
随着搜索引擎的广泛使用,搜索引擎技术得到了长足发展。如今的搜索引擎,已经不仅仅停留在为用户提供与检索词匹配的检索结果上,而是越来越关注如何才能更好地满足用户需求。
假如用户输入“qq个性签名”,搜索引擎不仅给出与用户输入的查询一致的结果,还给出与用户的查询需求相似的检索结果,如给出“qq个性签名伤感”、“qq个性签名搞笑”、“qq个性签名幸福”、“qq个性签名可爱”等具有相似需求的查询所对应的检索结果,搜索引擎就可以为用户在搜索结果的筛选与获得上提供最直接的参考,从而减少用户的检索次数,提升用户的搜索体验。而要让搜索引擎能够根据用户输入的查询,返回所有与用户输入的查询具有相似需求的检索结果,就需要对用户具有相似需求的查询进行挖掘。此外,对具有相似需求的查询进行挖掘,还可以为搜索引擎的其他应用提供资源,例如为生成与检索需求相关的查询模板提供语料,或者将相似需求的查询作为训练语料,训练与需求类型相关的分类器,还可以将相似需求查询以搜索建议的形式提供给用户,帮助及引导用户更快地找到与自己搜索意图接近的查询,从而获得更准确的搜索结果等等。
【发明内容】
本发明所要解决的技术问题是提供一种挖掘具有相似需求的查询的方法及装置,以提高搜索引擎满足用户需求的能力,从而减少用户的检索次数,减少检索系统的开销。
本发明为解决技术问题而采用的技术方案是提供一种挖掘具有相似需求的查询的方法,包括:为多个查询对提取会话共现特征、点击重合度特征或点击相互满足特征中的至少一个特征,其中一个查询对由搜索日志中的任意两个查询构成,所述会话共现特征用于表征一个查询对中的两个查询在相同会话中共同出现的可能性,所述点击重合度特征用于表征一个查询对中的两个查询各自引起的点击页面的重合度,所述点击相互满足特征用于表征一个查询对中的两个查询各自得到的满足度达到预设要求的页面满足该查询对中的另一个查询的程度;根据提取的每个特征及每个特征的权重计算各查询对中的两个查询之间的相似度;选取两个查询之间的相似度大于设定值的查询对,并在选取的查询对中将相互之间有交集的查询对聚为一类,将属于同一类的查询对中的查询作为具有相似需求的查询。
根据本发明之一优选实施例,一个查询对的会话共现特征采用下列方式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110379429.2/2.html,转载请声明来源钻瓜专利网。