[发明专利]一种基于ElasticSearch的数据高效检索方法在审
申请号: | 201811365956.6 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109542930A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 罗志勇;汪源野;韩冷;罗蓉;郑焕平;赵杰;蔡婷;杨美美 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2455 |
代理公司: | 重庆萃智邦成专利代理事务所(普通合伙) 50231 | 代理人: | 黎志红 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索条件 匹配 历史查询结果 高效检索 检索效率 建立索引 接收用户 历史查询 历史检索 请求结果 搜索引擎 重复计算 集群 搜索 共享 | ||
本发明请求保护一种基于ElasticSearch的数据高效检索方法。该方法包括:接收用户输入的第一检索条件,将共享的历史查询结果在ElasticSearch集群中建立索引,在新的第一检索条件请求到达时,首先与历史检索条件进行匹配,若能实现匹配,则直接将匹配部分的历史查询结果直接作为新检索条件请求结果的一部分。本发明利用ElasticSearch搜索引擎,减少了大量对历史查询的重复计算,节省了搜索时间,提高了检索效率。
技术领域
本发明属于数据检索领域,尤其涉及一种基于ElasticSearch的数据高效检索方法。
背景技术
随着信息技术的发展,越来越多的应用或者站点,每个月都会产生TB级别的数据。与此同时,越来越多的需求每天需要处理几PB,几百PB级的数据。,如何高效便捷地获取信息已成为当前互联网服务商亟待解决的问题,搜索系统的出现很好的解决了这一问题。搜索系统是指能对文本中特定关键字执行检索操作的软件系统,通常将能够进行全文检索的软件系统称为搜索引擎。但是,目前互联网上常见的各类搜索引擎架构以集中式为主,在容错性、访问效率、可扩展性、I/O方面存在瓶颈,越来越难以应对数据量飞速增加所带来的问题。
ElasticSearch是一款基于Lucene工具包的支持分布式的开源全文检索系统,在企业中非常受欢迎,维基百科(Wikipedia)、StackOverflow、Github等公司的全文检索、关键词高亮、实时键入搜索、自动纠错、相关内容推荐等功能都是基于ElasticSearch实现的。除此之外,ElasticSearch也备受创业公司的青睐,它对机器的性能没有较严苛的要求,即使在普通PC机组成的集群中也可以正常运行。
ElasticSearch目前还是一门比较新的技术,在国内的推广度还相当的有限,所以相当多的知识检索系统并没有用到该门技术。而ElasticSearch有其独有的全文搜索,结构化检索,搜索纠错,搜索推荐等等丰富的功能能够极大的满足用户的需求。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种提高检索效率的基于ElasticSearch的数据高效检索方法。本发明的技术方案如下:
一种基于ElasticSearch的数据高效检索方法,其包括以下步骤:
a.用户向开源分布式搜索引擎ElasticSearch发起查询请求;
b.对查询请求和历史查询集群进行匹配,所述历史查询集群是历史查询的集合所述匹配有两种情况:完全匹配和不完全匹配;
c.若完全匹配,则根据历史查询结果和继续查询的结果得出第一结果,若不完全匹配,则重新执行查询得到第二结果,查询的第一结果或第二结果反馈给用户;
d.若是不完全匹配,则将查询的第二结果更新历史查询集群。
进一步的,所述步骤a用户向ElasticSearch发起查询请求,所述查询请求包括提取用户在搜索引擎中输入的字符内容,并将查询请求作为第一检索条件。
进一步的,所述ElasticSearch是一款基于Lucene工具包的支持分布式的开源全文检索系统,利用该系统开源快速搭建一个零配置并且开源高效的搜索引擎,结合与历史查询结果集群,每次与其进行匹配,有相同查询结果的话直接取得该结果而不需要进行一次全局搜索。
进一步的,所述步骤b中对查询请求和历史查询集群进行匹配,匹配有两种情况:完全匹配和不匹配,主要步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811365956.6/2.html,转载请声明来源钻瓜专利网。