[发明专利]一种分布式检索方法及装置在审
申请号: | 202211265187.9 | 申请日: | 2022-10-17 |
公开(公告)号: | CN115905347A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 卢金奇;王朝硕;高兴宇;陈项中;张烜;李林城;杜浩滔;钱方 | 申请(专利权)人: | 中国南方电网有限责任公司超高压输电公司;中国科学院微电子研究所 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;G06F18/22;G06N3/04 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 马苗苗 |
地址: | 510700 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 检索 方法 装置 | ||
本发明公开了一种分布式检索方法及装置,其中分布式检索方法包括:获得附加数据集和两个以上的子数据集;其中附加数据集的数据量小于待检索数据集,且附加数据集和两个以上的子数据集均为基于待检索数据集获得的;基于用户输入的查询请求,分别在附加数据集和两个以上的子数据集中进行检索,获得附加数据集对应的第一检索结果,和每个子数据集对应的第二检索结果;其中,第一检索结果先于第二检索结果获得。本发明可提高检索准确性和检索响应速度。
技术领域
本发明涉及数据检索技术领域,尤其涉及一种分布式检索方法及装置。
背景技术
随着信息技术的发展5G网络、云服务、物联网、大数据等新技术逐步被广泛应用,随之带来的是海量的数据,以及海量数据带来的各种挑战。在海量客户数据的大背景下,常规的检索技术难以满足梳理海量数据的需求。例如,在海量数据中检索用户所需要使用的数据时,会存在检索响应慢,错误率高的问题,严重影响了用户的使用感受和查询效率。
因此,目前针对大量的数据的检索方式存在着检索响应慢,错误率高的缺陷。
发明内容
鉴于上述问题,本发明提出了一种分布式检索方法及装置,能够提高数据的检索准确性和检索响应速度。
第一方面,本申请通过一实施例提供如下技术方案:
一种分布式检索方法,包括:获得附加数据集和两个以上的子数据集;其中所述附加数据集的数据量小于所述待检索数据集,且所述附加数据集和所述两个以上的子数据集均为基于待检索数据集获得的;基于用户输入的查询请求,分别在附加数据集和所述两个以上的子数据集中进行检索,获得所述附加数据集对应的第一检索结果,和每个所述子数据集对应的第二检索结果;其中,所述第一检索结果先于所述第二检索结果获得。
可选的,所述获得附加数据集,包括:
根据所述待检索数据集对应的历史检索信息,获得一个或多个历史检索项;所述历史检索项为所述待检索数据集中的数据项;针对每一所述历史检索项,在所述待检索数据集中查找与所述历史检索项关联的关联数据项;基于所述历史检索项与所述关联数据项,获得附加数据集。
可选的,所述在所述待检索数据集中查找与所述历史检索项关联的关联数据项,包括:
基于所述待检索数据集中每个数据项的属性信息和所述历史检索项的属性信息,获得所述历史检索项与所述待检索数据集中每个数据项的相似度;将所述相似度大于预设相似度阈值的数据项,作为所述关联数据项。
可选的,所述数据项的属性信息包括与所述历史检索项的查询时间间隔;其中,所述查询时间间隔与相似度负相关。
可选的,所述基于所述待检索数据集中每个数据项的属性信息和所述历史检索项的属性信息,获得所述历史检索项与所述待检索数据集中每个数据项的相似度,包括:
将所述待检索数据集中每个数据项的属性信息分别输入预设的神经网络模型,获得每个数据项对应的第一编码数据;将所述历史检索项的属性信息输入所述神经网络模型,获得第二编码数据;基于所述第一编码数据和所述第二编码数据,确定所述历史检索项与所述待检索数据集中每个数据项的相似度。
可选的,所述基于所述历史检索项与所述关联数据项,获得附加数据集,还包括:
基于相似度大小为所述关联数据项配置索引顺序;其中,针对同一所述查询请求,所述关联数据项的索引顺序位于所述历史检索项之后;基于所述历史检索项与完成所述索引顺序配置的所述关联数据项,获得所述附加数据集。
可选的,获得两个以上的子数据集,包括:
获得两个以上的历史子数据集;基于所述附加数据集中关联数据项的索引顺序,对所述两个以上的历史子数据集进行更新,获得所述两个以上的子数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司超高压输电公司;中国科学院微电子研究所,未经中国南方电网有限责任公司超高压输电公司;中国科学院微电子研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211265187.9/2.html,转载请声明来源钻瓜专利网。