[发明专利]一种挖掘具有相似需求的查询的方法及装置有效
申请号: | 201110379429.2 | 申请日: | 2011-11-24 |
公开(公告)号: | CN103136223B | 公开(公告)日: | 2016-11-16 |
发明(设计)人: | 黄际洲 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种挖掘具有相似需求的查询的方法及装置,其中挖掘具有相似需求的查询的方法包括:为多个查询对提取会话共现特征、点击重合度特征或点击相互满足特征中的至少一个特征;根据提取的每个特征及每个特征的权重计算各查询对中的两个查询之间的相似度;选取两个查询之间的相似度大于设定值的查询对,并在选取的查询对中将相互之间有交集的查询对聚为一类,将属于同一类的查询对中的查询作为具有相似需求的查询。通过上述方式,可以从搜索日志中挖掘出具有相似需求的查询,从而为搜索引擎更好地满足用户需求提供了保障。 | ||
搜索关键词: | 一种 挖掘 具有 相似 需求 查询 方法 装置 | ||
【主权项】:
一种挖掘具有相似需求的查询的方法,其特征在于,所述方法包括:为多个查询对提取会话共现特征、点击重合度特征和点击相互满足特征,其中一个查询对由搜索日志中的任意两个查询构成,所述会话共现特征用于表征一个查询对中的两个查询在相同会话中共同出现的可能性,所述点击重合度特征用于表征一个查询对中的两个查询各自引起的点击页面的重合度,所述点击相互满足特征用于表征一个查询对中的两个查询各自得到的满足度达到预设要求的页面满足该查询对中的另一个查询的程度;根据提取的每个特征及每个特征的权重计算各查询对中的两个查询之间的相似度,其中,每个特征的权重为预先设置的值,或者,采用机器学习方法学习出每个特征的权重;选取两个查询之间的相似度大于设定值的查询对,并在选取的查询对中将相互之间有交集的查询对聚为一类,将属于同一类的查询对中的查询作为具有相似需求的查询。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110379429.2/,转载请声明来源钻瓜专利网。