[发明专利]用于有效预先计算的可分解的分级有效
申请号: | 201110373345.8 | 申请日: | 2011-11-22 |
公开(公告)号: | CN102521270A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | K.M.里斯维克;M.霍普克罗夫特;J.G.贝内特;K.卡尔亚纳拉曼;T.基林比;V.帕里克 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 孙之刚;刘鹏 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 有效 预先 计算 可分解 分级 | ||
技术领域
本申请涉及信息和文件搜索领域。
背景技术
在互联网上可得到的信息和内容的数量非常快速地持续增长。给定巨大数量的信息,搜索引擎已经被开发以便于搜索电子文件。特别地,用户可以通过输入搜索查询以搜索信息和文件,该查询包括用户可能感兴趣的一个或多个术语(term)。在从用户接收到搜索查询后,搜索引擎基于该搜索查询识别相关的文件和/或网页。因为其有用,网页搜索,即对于用户发出的搜索查询寻找相关网页和文件的过程,可以说已经成为互联网上当今最流行的业务。
搜索引擎通过如下方式运行:使用爬虫技术搜集(crawling)文件和在搜索索引中给关于该文件的信息编索引。当接收到搜索查询时,搜索引擎使用搜索索引以识别与该搜索查询相关的文件。例如,可以使用分级(ranking)功能以基于检索查询确定最相关的文件以呈现给用户。然而,分级功能已经变得日益复杂,这样数以百计的特征被用来分级文件。当单独使用时,复杂的分级功能由于成本和时间的约束是无效的。
发明概述
提供这个概述以按照简化的形式介绍概念的选择,所述概念将在下面的详细描述部分被进一步描述。这个概述其意不在标识所请求保护的主题的关键特征或者必要特征,也不在被用来帮助确定所请求保护的主题的范围。
本发明的实施方式涉及与整个分级过程的初步分级阶段结合使用的算法的生成。如下面进一步描述的,整个分级过程可以包括匹配阶段、初步分级阶段和最终分级阶段。可以给数以亿计或者甚至万亿计的文件编索引。因为最终分级功能通常比初步分级功能更加昂贵并且耗费时间,所以匹配阶段和初步分级阶段需要起作用以限制最终分级功能需要分级的候选文件的数量。通常,在初步分级阶段使用的初步分级功能是在最终分级阶段使用的最终分级功能的简化版本。这样,最终分级功能被分析以识别能够被预先计算的或者在接收查询后不容易被实时计算的分级特征(例如文件分级特征)以及容易被实时计算的分级特征。不在最终分级功能中使用的分级特征还可以在初步分级功能中被使用。一旦生成算法,其能够被用来计算文件的初步分级。
附图简述
下面参考附图详细描述本发明,其中:
图1是适于用来实现本发明实施方式的示例性计算环境的框图;
图2是在其中可以使用本发明的实施方式的示例性系统的框图;
图3是示出根据本发明的实施方式生成用于为多个文件提供初步分级的算法的方法的流程图;
图4是示出根据本发明的实施方式计算文件的初步分级的方法的流程图;和
图5是示出根据本发明的实施方式在初步分级阶段中利用来自最终分级阶段的分级特征以确定文件的初步分级方法的流程图。
详细描述
在这里带有特殊性地描述了本发明的主题以满足法定的要求。然而,该描述其自身并不意图限制本专利的范围。相反地,发明人已经预期到还可以结合其它现有或未来的技术按照其它方式具体化所请求保护的主题,以包括与本文档中描述的内容类似的不同步骤或步骤组合。此外,虽然在此处可以使用术语“步骤”和/或“框”表示所使用的方法的不同元素,但是该术语不被解释为意味了在此处公开的多个步骤之中或步骤之间有任何特定的顺序,除非明确描述了个别步骤间的顺序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110373345.8/2.html,转载请声明来源钻瓜专利网。