[发明专利]一种多段索引并行检索与算分的检索方法、装置及设备在审
| 申请号: | 201710196630.4 | 申请日: | 2017-03-28 |
| 公开(公告)号: | CN108664495A | 公开(公告)日: | 2018-10-16 |
| 发明(设计)人: | 万明成;李洋;王刚 | 申请(专利权)人: | 广东神马搜索科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吕静 |
| 地址: | 510000 广东省广州市天河区黄埔大道西平云*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 索引 检索 检索模块 并行检索 分模块 多段 装置及设备 文档信息 搜索引擎技术 并行运行 规则获得 检索效率 单片 多核 预设 并行 应用 | ||
1.一种多段索引并行检索与算分的检索方法,其特征在于,应用于多个索引段的检索与算分,所述多个索引段属于同一个单片索引,每个所述索引段对应一个独立的检索模块;所述方法包括:
算分模块获取每个所述检索模块检索到的文档信息;
所述算分模块根据预设的算分规则获得每个所述文档信息对应的算分结果。
2.根据权利要求1所述的方法,其特征在于,每个所述索引段还对应一个缓存空间,所述缓存空间用于存储与该缓存空间对应的检索模块检索到的文档信息;所述获取每个所述检索模块检索到的文档信息的步骤包括:
所述算分模块获取每个所述缓存空间所存储的文档信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
每个所述检索模块对检索到的文档信息进行合法性判断,若检索到的文档信息判定为合法,则该检索模块将判定为合法的文档信息写入该检索模块对应的缓存空间。
4.根据权利要求3所述的方法,其特征在于,所述若检索到的文档信息判定为合法,则该检索模块将判定为合法的文档信息写入该检索模块对应的缓存空间的步骤包括:
若检索到的文档信息判定为合法,该检索模块判断该检索模块对应的缓存空间是否有写入空间,若有写入空间,则该检索模块将判定为合法的文档信息写入该检索模块对应的缓存空间。
5.根据权利要求4所述的方法,其特征在于,所述若有写入空间,则该检索模块将判定为合法的文档信息写入该检索模块对应的缓存空间的步骤包括:
若有写入空间,则该检索模块获得该写入空间在所述缓存空间的实际位置;
该检索模块将判定为合法的文档写入该检索模块对应的缓存空间的相应位置区间,所述相应位置区间的起始位置为所述实际位置,所述相应位置区间的长度与该判定为合法的文档的长度匹配;
当该判定为合法的文档写入完成后,将所述实际位置更新为所述相应位置区间的结束位置,并将更新后的实际位置告知所述算分模块。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:若没有写入空间,则检索模块等待算分模块读取该索引段的缓存空间,直至有写入空间为止。
7.根据权利要求2所述的方法,其特征在于,所述算分模块获取每个所述缓存空间所存储的文档信息的步骤包括:
在所述缓存空间存在未读取的文档信息的情况下,算分模块获得读取标记位置;
所述算分模块读取所述读取标记位置处的文档信息;
读取完毕后,根据所读文档信息的长度更新所述读取标记位置,并将所更新的读取标记位置告知所述缓存空间对应的检索模块,以使该检索模块用于将所检索的文档存储于该读取标记位置处。
8.根据权利要求2所述的方法,其特征在于,所述算分模块根据预设的算分规则获得每个所述文档信息对应的算分结果的步骤之后,还包括:
所述算分模块判断所有的所述检索模块的检索线程是否结束,若没有结束,则判断当前缓存空间是否有数据可以读取,若当前缓存空间有数据读取,则算分模块获取当前缓存空间中的文档,并根据预设的算分规则获得每个所述文档信息对应的算分结果,直到当前缓存空间没有数据可以读取,则遍历下一个检索模块的缓存空间。
9.一种多段索引并行检索与算分的检索装置,其特征在于,包括:检索模块和算分模块,
所述检索模块,用于检索文档信息,并获取检索到的文档信息;
所述算分模块,用于获取每个所述检索模块检索到的文档信息;以及,所述算分模块,还用于根据预设的算分规则获得每个所述文档信息对应的算分结果。
10.一种多段索引并行检索与算分的检索设备,其特征在于,包括:存储器、处理器和多段索引并行检索与算分的检索装置,所述检索装置存储于所述存储器中并包括一个或多个由所述处理器执行的软件功能模组,所述检索装置包括:检索模块和算分模块,
所述检索模块,用于检索文档信息,并获取检索到的文档信息;
所述算分模块,用于获取每个所述检索模块检索到的文档信息;以及,所述算分模块,还用于根据预设的算分规则获得每个所述文档信息对应的算分结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东神马搜索科技有限公司,未经广东神马搜索科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710196630.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据匹配的方法、装置、电子设备和储存介质
- 下一篇:数据迁移方法及装置





