[发明专利]用于大文档索引的匹配漏斗有效
申请号: | 201110373395.6 | 申请日: | 2011-11-22 |
公开(公告)号: | CN102567461A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | K.M.里斯维克;M.霍普克洛夫特;J.G.贝内特;K.卡尔亚纳拉曼;T.基林比;C.P.沃特斯;J.O.彼得森 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 黄维;刘鹏 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了一种用于大文档索引的匹配漏斗。通过以多个阶段评估和修剪候选文档来响应于搜索查询识别并返回搜索结果。该过程采用对文档中发现的义原和文档/义原对的预先计算的评分编索引的搜索索引。当接收到搜索查询时,从搜索查询识别义原且基于所识别的义原生成重新阐述的查询。重新阐述的查询用于识别匹配文档,且使用简化评分函数和搜索索引中预先计算的评分来生成匹配文档的初步评分。基于初步评分来修剪文档,且使用最终排序算法来评估其余文档,最终排序算法提供排序文档的最终集合,其用于响应于搜索查询生成搜索结果以返回。 | ||
搜索关键词: | 用于 文档 索引 匹配 漏斗 | ||
【主权项】:
一个或多个计算机存储介质,其存储计算机可用指令,所述计算机可用指令当由计算设备使用时使所述计算设备执行包括以下的方法:接收(602)搜索查询;重新阐述(604)所述搜索查询以识别一个或多个义原;基于所述一个或多个义原来从搜索索引识别(606)文档的初始集合,所述搜索索引存储多个义原,所述多个义原包括一个或多个n元语法,一个或多个n‑元组和一个或多个近n‑元组;使用简化的评分函数和预先计算的评分计算(702)文档的初始集合中每个文档的初步评分,预先计算的评分存储于文档的初始集合和一个或多个义原的文档/义原对的搜索索引中;基于所述初步评分从所述文档的初始集合选择(704)文档的修剪集合;使用全排序算法来计算(408)所述文档的修剪集合中每个文档的排序评分;以及基于所述排序文档的集合提供(410)搜索结果以便向终端用户呈现。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110373395.6/,转载请声明来源钻瓜专利网。
- 上一篇:用于手术台可拆卸双层台面的固定装置
- 下一篇:限流电路断路器