[发明专利]使用已知高级查询的查询修订有效
申请号: | 200680017106.6 | 申请日: | 2006-03-13 |
公开(公告)号: | CN101176058A | 公开(公告)日: | 2008-05-07 |
发明(设计)人: | D·R·贝利;A·J·巴特尔;D·A·科恩;B·恩格尔哈特;P·P·纳亚克 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06F7/00 | 分类号: | G06F7/00 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 王茂华 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 已知 高级 查询 修订 | ||
相关申请的交叉引用
根据35 U.S.C.§120,本申请要求以下美国申请的优先权:美国申请系列号11/094,814(于2005年3月29日提交,名称为“Integration Of Multiple Query Revision Models”)、美国申请系列号11/096,198(于2005年3月30日提交,名称为“EstimatingConfidence For Query Revision Models”)、美国申请系列号11/095,920(于2005年3月30日提交,名称为“EmpiricalValidation Of Suggested Alternative Queries”)、美国申请系列号No.11/285,814(于2005年11月22日提交,名称为“QueryRevision Using Known Highly-Ranked Queries”),并且本申请涉及:
·美国申请系列号10/676,571,该申请于2003年9月30日提交,名称为“Method and Apparatus for Characterizing DocumentsBased on Clusters of Related Words”;
·美国申请系列号No.10/734,584,该申请于2003年12月15日提交,名称为“Large Scale Machine Learning Systems andMethods”;
·美国申请系列号10/749,440,该申请于2003年12月31日提交,名称为“Methods and Systems for Assisted Network Browsing”;以及
·美国申请系列号No.10/878,926,该申请于2004年6月28日提交,名称为“Systems and Methods for Deriving and Using anInteraction Profile”;
在此通过参考将以上每个申请引入。
技术领域
本发明通常涉及信息检索系统,并且更具体地,本发明涉及用于修订用户查询的系统和方法。
背景技术
通常,信息检索系统(如通过因特网搜索引擎所示例的那些信息检索信息)能够快速提供通常与用户查询相关的文档。搜索引擎可以使用词语和文档频率的各种统计测量以及文档之间和词语之间的关联,来确定文档对于查询的相关性。支持大多数搜索引擎设计的一个关键技术假设在于,用户查询精确地表示了用户期望的信息目标。
实际上,用户通常难以明确表达好的查询。经常地,单一查询不能提供期望的结果,并且用户频繁地输入关于相同主题的许多不同查询。通常,这些多查询包括查询词语的宽度和特征中的变化、猜测的实体名称、词序、词的数量中的变化等,在实现期望的结果集之前,有时候会形成长的查询链。由于不同用户对于成功地修订他们的查询具有差异很大的能力,因而已经提出了各种自动化的查询修订方法。
最普通地,使用查询精化(refinement)来从较为一般的查询生成更为精确(例如,更窄)的查询。当用户输入过于宽泛的查询时,查询精化非常有用,其中这种过于宽泛的查询的前面的结果包括与用户所需信息相关的文档的超集。例如,用户想要关于Mitsubishi Galant汽车的信息,则该用户可能输入“Mitsubishi”这种过于宽泛的查询,而结果将覆盖许多不同的Mitsubishi公司,而不仅是汽车公司。由此,希望对查询进行精化(尽管因为缺少额外上下文以确定用户需要的特定信息,这是困难的)。
然而,当用户输入过于具体的查询,其中正确的修订是扩展查询时,或者当前面的结果与用户的信息需要无关时,查询精化是没用的。例如,查询“Mitsubishi Galantinformation(三菱Galant信息)”可能由于词语“information(信息)”导致很少的结果(在此情况下,关于Mitsubishi Galant汽车的结果过少)。在此情况下,正确的修订是将该查询扩展到“Mitsubishi Galant”。由此,尽管查询精化在某些情况下起作用,但存在大量情况是,其中通过使用其他查询修订技术来最好地满足用户的信息需要。
另一查询修订策略使用同义字列表或者词典来扩展查询,以便捕获用户的潜在信息需要。然而,正如查询精化那样,对于修订查询而言查询扩展并非总是适合的方式,并且结果的质量非常依赖于查询词语的上下文。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680017106.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于计算机分析来改良菌株的方法
- 下一篇:等离子显示板