[发明专利]从用户日志推断搜索类别同义词有效

专利信息
申请号: 200680051098.7 申请日: 2006-11-22
公开(公告)号: CN101361068A 公开(公告)日: 2009-02-04
发明(设计)人: 迈克尔·D·赖利;刘志彦 申请(专利权)人: 谷歌公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中原信达知识产权代理有限责任公司 代理人: 钟强;郑立
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用户 日志 推断 搜索 类别 同义词
【说明书】:

技术领域

与本发明的原理一致的实施方式一般涉及查询处理,更具体地,涉及提供搜索查询精化。 

背景技术

尽管因特网追溯到20世纪60年代晚期,但是个人计算以及网络互联的广泛可用性以及认可度已经导致在信息共享技术方面的爆炸性增长以及空前的发展。具体地,万维网(“Web”)已经使世界范围的受众对所存储的电子形式的数不清的信息量的可访问性发生巨大变化,包括书面的、口头的(音频)以及可视的(图像以及视频)信息,两者都有归档的以及实时的格式。简而言之,Web已经向每个所连接的用户提供对以世界范围内几乎所有语言的实质上无限的信息库的桌面访问。 

搜索引擎已经随着Web使用不断增加而快速发展,以使用户能够以有效并且及时的方式找到以及检索相关的Web内容。随着Web内容的数量以及类型不断增加,搜索引擎的复杂度以及精确性也已提高。一般地,搜索引擎响应于搜索查询而努力提供最高质量的结果。然而,确定质量是困难的,因为所检索的Web内容的相关性是固有主观的并且取决于用户的兴趣、知识以及态度。 

搜索引擎所使用的现有方法是基于将搜索查询词语与从Web页面索引的词语进行匹配。更先进的方法使用例如基于超链接结构的分析来确定所检索的Web内容的重要性。 

典型的搜索查询情景(scenario)以提交给搜索引擎的自然语言问 题或通常为关键字形式的单独的词语开始。搜索引擎对照用于描述潜在地可检索的Web内容的信息特征的数据知识库来执行搜索,并且识别候选网页。搜索经常可以返回数千乃至数百万的结果,因而大多数搜索引擎典型地仅对最有希望的结果的子集进行排名或评分。然后,通常以Web内容标题、超链接、以及诸如从网页选取的文本摘录的其它描述性信息的形式将最佳网页呈现给用户。 

提供优质的搜索结果可能被搜索查询自身的字面上的以及隐含的范围所复杂化。构造拙劣(poor-framed)的搜索查询可能是含糊的或是太笼统或太详尽而不能产生响应性的以及高质量的搜索结果。例如,在搜索查询内的词语可能在语法或语义的层次上是含糊的。语法模糊可能是疏忽同音异义词而造成的结果,其中指定了具有相同的发音并且可能具有相同的拼写但是与该单词实际含义不同的含义的错误单词。例如,单词“bear”可以表示或可以指一种动物或没穿衣服。语义模糊可能是不适当的上下文造成的结果。例如,单词“jaguar”可以指一种动物、Macintosh操作系统的一个版本、或一种汽车商标。类似地,太笼统的搜索词语导致过度宽泛的搜索结果,而太狭窄的搜索词语导致过度限制的以及非响应性的搜索结果。 

因此,需要一种为搜索查询精化提供建议的方法,该方法将解决发生在适当框架的搜索查询中的含糊或过度笼统或过度详尽。优选地,这样的方法将提供精化的搜索查询,当该精化的搜索查询被发布时导致搜索结果与隐含在最初的搜索查询的意图下的实际主题密切相关,并且提供将概念上的独立以及清晰的含义反映为潜在的搜索词语的建议。 

发明内容

根据与本发明的原理一致的一个实现方式,一种方法可以包括:识别至少包括与在先结果数据相关的查询信息以及类别信息的在先查询数据;确定查询信息是否是类别信息的同义词;以及如果确定查询 信息是类别信息的同义词,则在随后的搜索请求中使用该查询信息以及类别信息。 

根据与本发明的原理一致的另一个实现方式,一种系统可以包括:用于确定包括在在先搜索结果内的查询数据以及类别数据是否是类别同义词的装置;以及如果确定查询数据以及类别数据是类别同义词,则用于将查询数据并入到与类别数据相关联的随后的搜索请求的装置。 

根据与本发明的原理一致的又一个实现方式,一种设备可以包括:用于识别包括与在先搜索请求相关联的至少一个查询、类别对的历史日志数据的逻辑;用于确定在查询、类别对中的查询是名称查询还是类别查询的逻辑;以及当确定查询是类别查询时,用于确定查询是否是类别的同义词的逻辑。 

根据与本发明的原理一致的又一个实现方式,一种方法可以包括:从客户端接收搜索查询;基于所接收的搜索查询来识别结果类别;识别所识别的结果类别的类别同义词;以及基于结果类别以及所识别的类别同义词执行结果搜索。 

附图说明

并入本说明书并且构成本说明书的一部分的附图示出了本发明的实现方式,并且与描述一起来解释本发明。在图中, 

图1是示出了与本发明的原理一致的概念的示例图; 

图2是其中可以实现与本发明的原理一致的系统以及方法的网络的示例图; 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200680051098.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top