[发明专利]计算系统中的分布式索引搜索有效
申请号: | 201880011562.2 | 申请日: | 2018-02-07 |
公开(公告)号: | CN110291515B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | N·拉古纳坦;L·布巴郎;A·N·拉古纳坦;T·斯里拉姆;D·S·乌塔亚桑卡拉林加姆;R·托马斯;T·谢里夫 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李光颖 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 系统 中的 分布式 索引 搜索 | ||
在本文中公开了提供分布式索引搜索的计算机系统、设备以及相关联的方法。在一个实施例中,一种方法包括:在数据库服务器处从成员接收在对内容的搜索查询中所包括的搜索项;并且响应于接收到所述搜索项,基于在数据库服务器上接收到的搜索项以及搜索特征的一个或多个记录,响应于搜索查询而确定待搜索的分布式索引的子集。所述方法还包括基于搜索查询中的搜索项来提供确定出的待搜索的分布式索引的列表。
背景技术
公司、学校、慈善机构、政府实体以及其他类型的组织常常部署私有计算机网络,通常被称为内联网。这样的内联网能够包括服务器、网络设备或者在组织控制下的其他合适的设备,或者能够包括基于web的解决方案,诸如Google 或计算平台。内联网能够允许组织的成员在企业内安全地共享信息。例如,内联网能够被配置为存储、跟踪或者以其他方式管理组织的内部文档。相反,术语“互联网”通常指代将个人和组织互连的公共计算机网络。一个这样的示例是因特网,其基于TCP/IP协议在全世界包含数十亿互连的计算机。
发明内容
提供本发明内容是为了以简化的形式介绍一些概念,这些概念将在下文的具体实施方式中进一步描述。本发明内容并不旨在标识所要求保护的主题的关键特征或必要特征,也并不旨在用于限制所要求保护的主题的范围。
内联网能够为组织的成员提供搜索组织内的各种类型的内容项的能力。例如,内联网能够包括存储电子邮件、文档、视频、音频、网页或者其他合适类型的内容的一个或多个储存库。内联网还能够包括允许组织的成员搜索和取回任意存储内容的搜索引擎。这样的搜索能够基于例如关键字、替代短语或者其他合适的标准。然后,搜索引擎能够将内容项的列表作为搜索结果返回给成员。
促进对内容的搜索和取回的一个挑战是在对内联网上的各种内容项的索引进行编译和维护时所涉及的努力。例如,某些内联网可能包括数千个包含不同内容项的内容服务器。为了编译和更新引用跨这样的众多内容服务器的所有内容项的主索引可能由于准确性、延迟以及其他要求而涉及大量的努力和成本。例如,内容项中的改变可能需要在主索引中快速地更新以确保对内容项的准确索引。编译这样的主索引也不容易缩放,因为每个内容项对应于主索引中的条目。另外,服务器或者支持主索引的其他合适的组件能够是针对整个搜索和取回系统的单点故障。
用于解决前述挑战的一种技术是将主索引划分为多个分布式子索引(或“碎片”)。替代直接引用内容项,而是主索引引用子索引之一,而该子索引继而直接引用内容项。在搜索期间,主索引能够标识可能包含(一个或多个)搜索到的内容项的碎片,并且以通常被称为“扇出(fan out)”的技术将对(一个或多个)内容项的搜索和取回委托给(一个或多个)碎片。然而,这样的技术仍然涉及在编译、更新和维护在主索引与子索引之间的引用方面的巨大努力。例如,一旦建立、更改或者移除了在子索引与内容项之间的引用,则必须立即相应地更新主索引,以便确保任何提供的搜索数据是准确并且“新鲜的”。
所公开的技术的若干实施例能够通过提供以下项来解决前述挑战中的至少一些挑战:(i)托管接近于对应内容项的分布式索引(或碎片)的服务器,以及(ii)托管包含与组织、子组织、成员组或者组织的个体成员有关的内容项的搜索特征的记录的数据库的数据库服务器。例如,这样的搜索特征能够包括组织、子组织、成员组和/或组织的成员中的热门(top)关键字、查询历史、搜索量或者其他活动。能够使用爬虫(crawler)或者其他合适的组件和/或技术从托管分布式索引的个体服务器周期性地收集这样的搜索特征的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880011562.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通过逻辑映射遍历智能合约数据库
- 下一篇:信息处理设备、信息处理方法和程序