[发明专利]用于查询执行的动态查询主代理有效
申请号: | 201210079487.8 | 申请日: | 2012-03-23 |
公开(公告)号: | CN102693274B | 公开(公告)日: | 2017-08-15 |
发明(设计)人: | K.M.里斯维克;M.霍普克罗夫特;K.卡尔亚纳拉曼;T.基林比;H.塞蒂亚万;C.W.安德森 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王英 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 查询 执行 动态 代理 | ||
相关申请的交叉引用
本申请是2010年11月22日提交的题为“HYBRID-DISTRIBUTION MODEL FOR SEARCH ENGINE INDEXES(用于搜索引擎索引的混合分布模型)”的申请号为12/951,815(律师档案号MFCP. 157166)的美国申请的部分继续申请,其全部内容被通过引用结合到本文中。
背景技术
因特网上可用的信息和内容的量非常快地持续增长。给定巨大的信息量,已经开发了搜索引擎来促进对电子文档的搜索。特别地,用户可以通过输入包括对于用户而言可能感兴趣的一个或多个词语的搜索查询来搜索信息和文档。在从用户接收到搜索查询之后,搜索引擎基于该搜索查询来识别相关的文档和/或网页。由于其实用性,网络搜索、亦即为用户发布的搜索查询找到相关网页和文档的过程已可证明地变成当今因特网上的最流行的服务之一。
此外,搜索引擎通常使用单步过程,其利用搜索索引以便基于接收到的搜索查询来识别要向用户返回的相关文档。然而,搜索引擎排序(ranking)功能已显现成非常复杂的功能,如果被用于被编索引的每个文档的情况下可能既费时又昂贵。另外,这些复杂公式所需的数据的存储也可能引起问题,尤其是在被以通常用词语或短语来编索引的逆向索引来存储时。当以逆向索引来存储时,复杂公式所需的相关数据的提取是低效的。
发明内容
提供本发明内容是为了以简化形式来介绍下文在详细说明中进一步描述的概念的选择。本发明内容并不意图识别要求保护的主题的关键特征或必要特征,也并不意图被用于帮助确定要求保护的主题的范围。
本发明的实施例涉及跨越同一组节点采用原子分片(atom-sharded)和文档分片(document-sharded)分布这两者,使得每个节点或机器既存储逆向索引的一部分(例如按原子分片)又存储前向索引的一部分(例如按文档分片)。可以为片段(segment)分配其负责的一组文档。既按原子又按文档来为该组文档编索引,使得存在与该组文档相关联的逆向索引和前向索引。每个片段包括多个节点,并且可以为每个节点分配逆向和前向索引两者的不同部分。此外,每个节点负责使用存储在其上面的逆向和前向索引部分这两者来执行多个排序计算。例如,初步排序过程可以利用逆向索引且最终排序过程可以利用前向索引。这些排序过程形成被用来基于接收到的搜索查询来识别最相关文档的总排序过程。
本发明的其它实施例针对初步片段根(segment root)和最终片段根的选择。一般地,基于选择初步片段根时的任何已知信息来选择初步片段根,并且仅仅临时地使用该初步片段根直至最终片段被选择。在实施例中,初步片段根利用算法基于从构成片段的各种节点或机器接收到的统计数据来选择最终片段根。如在本文中将更详细地解释的,存在用来分解(resolve)搜索查询的许多片段,每个片段包括多个节点或机器。仅从其搜索索引包含存在于已被接收到的搜索查询中的词语或原子的那些节点选择初步片段根。该组节点仅包括将被用来执行特定搜索查询的节点。一旦能够提供更多的信息,诸如输入/输出负荷、当前和预期负荷,包括查询队列、与节点相关联的问题信号等,则选择最终片段根,使得跨越网络传输最小量的数据,因此降低执行搜索查询的总成本。
附图说明
下面参考附图来详细地描述本发明,在附图中:
图1是适合于在实现本发明的实施例时使用的示例性计算环境的方框图;
图2是其中可以采用本发明的实施例的示例性系统的方框图;
图3是依照本发明的实施例的混合分布系统的示例图;
图4是依照本发明的实施例的图示有效负荷要求的混合分布系统的示例图;
图5是示出依照本发明的实施例的用于利用混合分布系统以便基于搜索查询来识别相关文档的方法的流程图;
图6是示出依照本发明的实施例的用于生成用于多过程文档检索系统的混合分布系统的方法的流程图;
图7是示出依照本发明的实施例的用于利用混合分布系统以便基于搜索查询来识别相关文档的方法的流程图;以及
图8~10是示出依照本发明的实施例的用于从多个节点识别片段根的各种方法的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210079487.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种玻璃下料装置
- 下一篇:一种促使枫香产脂的化学方法