[发明专利]基于分类的全文搜索有效
申请号: | 201610162742.3 | 申请日: | 2016-03-21 |
公开(公告)号: | CN107220249B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 陈超;刘晶晶;张磊;薛丁萌;周旻弘;代洪涛 | 申请(专利权)人: | 伊姆西IP控股有限责任公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分类 全文 搜索 | ||
本公开内容的各种实施例提供了一种基于分类的全文搜索的方案。在一些实施例中,提供了一种用于全文搜索的方法。该方法包括基于所获得的电子文档的内容生成第一全文索引。该方法还包括分类电子文档以确定电子文档的类别标识符,以及基于类别标识符生成第二全文索引。该方法进一步包括存储第一全文索引和第二全文索引。
技术领域
本公开内容的各种实施方式涉及全文搜索领域,并且更具体地,涉及用于基于分类的全文搜索的方法、设备和系统。
背景技术
随着互联网以及数据库技术的快速发展,对信息的搜索已经成为广泛存在的需求。全文搜索(full text search)是信息搜索领域中一种越来越受欢迎的搜索方法。
通常在全文搜索系统中,搜索引擎将电子文档的内容解析成全文索引并且将全文索引存储在索引库中。每个全文索引可以包括电子文档的一个或多个字、词、符号或句子。在使用过程中,搜索引擎使用用户输入的关键字在索引库中进行搜索,并且返回与匹配的全文索引对应的电子文档。然而,这种搜索过程返回的搜索结果通常难以使得用户满意,特别是当索引库中存储有大量的电子文档的全文索引时。
发明内容
本公开内容的多种实施方式提供了一种基于分类的全文搜索的方案。
根据本公开内容的第一方面,提供了一种用于全文搜索的方法。该方法包括基于所获得的电子文档的内容生成第一全文索引。该方法还包括分类电子文档以确定电子文档的类别标识符,以及基于类别标识符生成第二全文索引。该方法进一步包括存储第一全文索引和第二全文索引。
根据本公开内容的第二方面,提供了一种用于全文搜索的方法。该方法包括获取用户输入的搜索项,搜索项至少包括与待搜索的电子文档的类别标识符有关的类别关键词。该方法还包括将搜索项与预定义的多个全文索引进行匹配。多个全文索引至少包括第一全文索引,第一全文索引与通过分类至少一个电子文档而确定的类别标识符有关。该方法进一步包括基于所匹配的全文索引,确定相关联的电子文档。
根据本公开内容的第三方面,提供了一种用于全文搜索的设备。该设备包括至少一个处理单元;以及至少一个存储器。至少一个存储器耦合至至少一个处理单元并且在其上存储指令,指令在由至少一个处理单元执行时执行包括以下各项的动作:基于所获得的电子文档的内容生成第一全文索引;分类电子文档以确定电子文档的类别标识符;基于类别标识符生成第二全文索引;以及存储第一全文索引和第二全文索引。
根据本公开内容的第四方面,提供了一种用于全文搜索的设备。该设备包括至少一个处理单元;以及至少一个存储器。至少一个存储器耦合至至少一个处理单元并且在其上存储指令,指令在由至少一个处理单元执行时执行包括以下各项的动作:获取用户输入的搜索项,搜索项至少包括与待搜索的电子文档的类别标识符有关的类别关键词;将搜索项与预定义的多个全文索引进行匹配,多个全文索引至少包括第一全文索引,第一全文索引与通过分类至少一个电子文档而确定的类别标识符有关;以及基于所匹配的全文索引,确定相关联的电子文档。
根据本公开内容的第五方面,提供了一种用于全文搜索的系统。该系统包括根据第三方面描述的用于全文搜索的设备。该系统还包括根据第四方面描述的用于全文搜索的设备。该系统进一步包括全文索引库,被配置为存储第一全文索引和第二全文索引。
根据本公开内容的第六方面,提供了一种计算机可读存储介质。该计算机可读存储介质具有存储在其上的计算机可读程序指令。这些计算机可读程序指令用于执行根据以上第一方面所描述的方法的步骤。
根据本公开内容的第七方面,提供了一种计算机可读存储介质。该计算机可读存储介质具有存储在其上的计算机可读程序指令。这些计算机可读程序指令用于执行根据以上第二方面所描述的方法的步骤。
提供发明内容部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开内容的关键特征或主要特征,也无意限制本公开内容的范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伊姆西IP控股有限责任公司,未经伊姆西IP控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610162742.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于存储数据的方法和装置
- 下一篇:一种模板配置方法及系统