[发明专利]一种基于抽样的分布式搜索结果合并翻页方法及系统有效

专利信息
申请号: 201410204444.7 申请日: 2014-05-14
公开(公告)号: CN103942346A 公开(公告)日: 2014-07-23
发明(设计)人: 梁峰 申请(专利权)人: 焦点科技股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京知识律师事务所 32207 代理人: 张苏沛
地址: 210061 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于抽样的分布式搜索结果合并翻页方法及系统,旨在显著降低分布式搜索结果合并翻页过程中,存在的网络带宽和计算消耗较大的问题,同时本发明亦可改良后应用于其它分布式查询系统的结果合并翻页中。其技术方案为:对索引数据切片,形成索引文件切片,然后分到各个切片搜索服务器(shard-search server)上,完成了索引文件的初始化工作;搜索结果合并节点(gather)接收外部系统的合并翻页请求,进入基于抽样的分布式搜索结果合并翻页具体步骤。
搜索关键词: 一种 基于 抽样 分布式 搜索 结果 合并 翻页 方法 系统
【主权项】:
一种基于抽样的分布式搜索结果排序翻页方法,其特征在于,包括:对索引数据切片,形成索引文件切片,然后分到各个切片搜索服务器(shard‑search server)上,完成了索引文件的初始化工作;搜索结果合并节点(gather)接收外部系统的合并翻页请求,进入步骤1;步骤1:搜索结果合并节点(gather)分别向各个切片搜索服务器发送查询及针对搜索结果的抽样请求,并等待响应结果;步骤2:切片搜索服务器(shard‑search server)依照查询条件检索,并对命中结果排序,最后从排序结果中获取能够涵盖当前翻页的前若干条记录,针对这些记录,切片搜索服务器以固定步长做整数倍抽样,并将抽样记录返回;步骤3:搜索结果合并节点(gather)在获取到各个切片搜索服务器(shard‑search server)的抽样结果后,将它们按照排序域值做统一排序;步骤4:基于步骤3的排序结果,搜索结果合并节点(gather)进一步计算出所需目标翻页的记录在各个切片上的大致开始位置(startpoint),同时将肯定不属于目标翻页的记录排除在外;步骤5:基于步骤4的结果,搜索结果合并节点(gather)向各个切片发起召回记录的请求,这些请求只召回从目标翻页记录在各个切片上大致开始位置(startpoint)向下的少量记录;步骤6:各个切片搜索服务器(shard‑search server)接收到记录召回请求,查找后返回目标记录;步骤7:搜索结果合并节点(gather)在获取到各个切片搜索服务器(shard‑search server)的召回结果后,将其再次按照排序域值排序,再结合各个切片对应的目标翻页记录在各个切片上大致开始位置(startpoint)从排序结果中截取出目标翻页记录,至此整个过程完毕。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410204444.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top