[发明专利]包括使用可重用索引字段的对特征的索引和搜索有效
申请号: | 201210062505.1 | 申请日: | 2012-03-09 |
公开(公告)号: | CN102708136A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | H·G·索罕;O·弗莱德博格;E·M·罗克;M·苏赛格 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 使用 重用 索引 字段 特征 搜索 | ||
技术领域
本申请涉及包括使用可重用索引字段的对特征的索引和搜索。
背景技术
索引方法被作为对搜索系统和技术进行优化的部分来用于管理复杂计算环境的信息以提供相关的搜索结果。许多当前的搜索引擎对于要索引的项的每个方面或属性使用不同的物理字段结构来对这些项进行索引,导致非常巨大和高度维护的数据结构。例如,典型的技术报告可以具有多个属性,例如标题、统一资源定位符(URL)、主要内容、作者、最近编辑的日期和时间等一些示例。产品描述可以包括例如价格、大小、重量、颜色和口味等示例的属性。要索引和使用的不同类型的信息可以随着一个承租人到下一承租人的不同而显著不同,导致大量物理索引字段和相关联的索引的空区域。承租人可以意指承租和/或使用与其他人共享的基础结构但与其他承租人在逻辑上隔离的人或组织。
相应地,当将搜索作为一种服务提供时,搜索系统需要认识到一个事实,即不同的消费者或承租人要索引不同类型的项。通常,搜索服务对于所有不同的承租人的所有的项的所有的属性的并集使用专用的物理结构,导致一个具有许多空洞(hole)和高数量的物理结构来处理所有各种属性的索引。一个解决方案是为每个承租人使用单独的索引,这导致比在同一索引中存储所有属性的并集时更大总数的物理结构。然而,当前的索引技术没有被配置为将物理索引字段重用(reuse)作为提供索引和搜索服务的部分。
发明内容
提供本发明内容以便以简化的形式介绍将在以下的具体实施例中进一步描述的一些概念。本发明内容并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
实施例提供了索引和搜索特征,但不局限于此。在一个实施例中,计算系统被配置为对于不同承租人重用或重新确定物理索引字段以作为提供索引和搜索服务的部分。一个实施例的方法操作为提供包括许多可重用索引字段的经索引的数据结构,所述可重用索引字段被共享并被用于索引与多个承租人相关联的信息。还包括其他实施例。
通过阅读下面的详细描述并参考相关联的附图,这些及其它特点和优点将变得显而易见。可以理解,前述一般描述和以下详细描述均仅是说明性的,并且不限制所要求保护的本发明。
附图说明
图1是示例性计算环境的框图。
图2描述了包括许多重用索引字段的示例性索引表示。
图3A-3C描述了许多示例性的承租人索引集以及示例性的索引表示。
图4是描述了作为搜索服务的部分来提供索引操作的示例性的过程的流程图。
图5是描述了配置用于提供索引和搜索服务的示范性系统的组件的框图。
图6描述了用于每承租人不同索引的解决方案的许多文件(资源)的差异。
图7是示出用于实现此处所描述的各个实施例的示例性计算环境的框图。
具体实施方式
图1是示范性计算环境100的框图,该环境包括提供索引、搜索和/或其他信息处理操作的处理、存储器以及其他组件/资源。环境100的组件包括用于爬行内容、添加元数据、产生索引表示以及提供搜索查询(不局限于此)的特征和功能性。如下所述,一个实施例的索引模型可被用于提供包括许多可重用索引字段的索引结构,其中,每个可重用索引字段被配置为包含每个承租人的相同数据类型的不同数据,但不局限于此。
例如,环境100的组件可以操作以将不同承租人的相同数据类型路由或映射到同一索引字段结构,以便将可排序的属性存储在同一物理索引字段中。在一个实施例中,环境100的组件使用每个承租人的模式模型以及从每个承租人模式到所定义的可重用索引字段的映射,因为每个承租人通常要求使用他们自己的特定项和/或少量唯一或承租人专用的属性。这样,所有相关联的承租人可以部分基于可重用字段索引模型来共享和重用与唯一的或承租人专用的属性相关联的减少的索引以及物理索引字段的有限集合。
如下所述,根据一个实施例,环境100的组件对于多个承租人的不同属性自动使用相同物理字段,这显著地减少了相关联的索引的物理字段的总数。组件可以将特征(例如排序、细化器、范围搜索、查询等)的项属性或要求用作到可用的可重用物理索引字段的映射操作的部分。这样,组件可以直接使用索引技术,因为映射对于与索引服务相关联的所有承租人都映射到相同类型的字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210062505.1/2.html,转载请声明来源钻瓜专利网。