[发明专利]一种基于Solr的中文检索方法在审
申请号: | 201611241315.0 | 申请日: | 2016-12-29 |
公开(公告)号: | CN106649800A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 林芝聪;周华;宋小厚 | 申请(专利权)人: | 南威软件股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 泉州市潭思专利代理事务所(普通合伙)35221 | 代理人: | 廖仲禧 |
地址: | 362000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 solr 中文 检索 方法 | ||
技术领域
本发明涉及计算机技术领域,具体涉及一种基于Solr的中文检索方法。
背景技术
随着大数据的广泛应用,在我们的日常生活中,充斥的越来越多的数据。如何管理以及存储这些海量的数据,并且怎么从这些庞大的数据中获取到自己所需要的信息成了一个很大的问题。而对于政府机构,这个问题无疑更严重了。因为从最早的政务信息化到现在,政府部门累积了大量的数据,例如审计部门,报表与法律法规文档数不胜数,而且这些数据都是需要登记在案的,一旦需要查询,或者修改这些数据,按照原来的数据修改机制,需要采用人工查找的方式来找到需要修改的数据,这必然会严重影响工作效率。
越来越需要自主可控的政务办公系统需要实现高效率的全文检索,并且政务办公系统通常需要在国产化硬件系统上运行,而目前的开源检索技术都不能够用中文进行直接检索,称为政务办公系统的发展瓶颈。
发明内容
本发明的目的在于提供一种基于Solr的中文检索方法,用于使用中文进行高效的全文检索,提高大数据背景下的数据检索效率。
为了达到上述目的,本发明采用这样的如下技术方案:
本发明提供一种基于Solr的中文检索方法,包括:
SolrCloud平台接收Solrj客户端创建的查询语句,所述Solrj客户端用于根据用户的查询请求创建所述查询语句,所述SolrCloud平台中创建有基于中文分词的多个中文索引库;
所述SolrCloud平台对所述查询语句进行中文分词处理,得到中文分词处理后的多个中文词语;
所述SolrCloud平台根据所述多个中文词语分别创建对应的搜索索引;
所述SolrCloud平台使用所述多个中文词语分别对应的搜索索引对所述SolrCloud平台内的多个中文索引库进行全文检索;
所述SolrCloud平台从所述多个中文索引库获取到检索结果,并向所述Solrj客户端发送所述检索结果。
采用上述技术方案后,本发明提供的技术方案将有如下优点:
本发明实施例中搭建的SolrCloud平台中创建有基于中文分词的多个中文索引库,因此当Solrj客户端创建查询语句之后,SolrCloud平台对该查询语句进行中文分词处理,根据多个中文词语分别创建对应的搜索索引,SolrCloud平台使用多个中文词语分别对应的搜索索引对多个中文索引库进行全文检索,SolrCloud平台从多个中文索引库获取到检索结果,并向Solrj客户端发送所述检索结果。本发明实施例中使用中文进行高效的全文检索,提高大数据背景下的数据检索效率。
附图说明
图1为本发明实施例提供一种基于Solr的中文检索方法的流程方框示意图;
图2为本发明实施例提供的检索流程示意图。
具体实施方式
本发明实施例提供了一种基于Solr的中文检索方法,用于使用中文进行高效的全文检索,提高大数据背景下的数据检索效率。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
以下分别进行详细说明。
本发明基于Solr的中文检索方法的一个实施例,请参阅图1所示,可以包括如下步骤:
步骤10、SolrCloud平台接收Solrj客户端创建的查询语句,Solrj客户端用于根据用户的查询请求创建查询语句,SolrCloud平台中创建有基于中文分词的多个中文索引库;
步骤20、SolrCloud平台对查询语句进行中文分词处理,得到中文分词处理后的多个中文词语;
步骤30、SolrCloud平台根据多个中文词语分别创建对应的搜索索引;
步骤40、SolrCloud平台使用多个中文词语分别对应的搜索索引对SolrCloud平台内的多个中文索引库进行全文检索;
步骤50、SolrCloud平台从多个中文索引库获取到检索结果,并向Solrj客户端发送检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南威软件股份有限公司,未经南威软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611241315.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种内容推广方法、装置及电子设备
- 下一篇:茶几(61897)