[发明专利]一种全文检索方法及系统在审
申请号: | 201711441728.8 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108255972A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 张迪;崔俊啸;臧德波;蔺川;景长超;张鹏;褚波 | 申请(专利权)人: | 浪潮通用软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件数据 目标描述信息 检索关键词 检索信息 描述信息 目标文件 全文检索 文件索引 索引 数据检索效率 构建 解析 展示 | ||
本发明提供了一种全文检索方法及系统,该方法包括:获取至少一个文件数据,确定每一个所述文件数据对应的描述信息;根据所述描述信息,构建每一个所述文件数据对应的文件索引;获取用户输入的检索信息;从所述检索信息中解析出至少一个检索关键词;从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引;确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。本方案能提高数据检索效率。
技术领域
本发明涉及计算机技术领域,特别涉及一种全文检索方法及系统。
背景技术
随着计算机技术的发展,数据呈现爆发式增长,如何从文件系统中快速检索到目标数据,对提高数据处理效率具有重要影响。
Hadoop提供的分布式文件系统可存储大量的数据,各个数据分散存储在不同的存储装置中,例如分散在各个磁盘中。用户在检索目标数据时,需要对存储装置进行逐个查看,以确定存储装置中是否存在目标数据。
由于文件系统中存储的数据量较大,各个数据的存储位置也不尽相同,因此采用逐个查找存储装置的方式来检索目标数据,效率较低。
发明内容
本发明实施例提供了一种全文检索方法及系统,能提高数据的检索效率。
第一方面,本发明实施例提供了一种全文检索方法,包括:
获取至少一个文件数据,确定每一个所述文件数据对应的描述信息;
根据所述描述信息,构建每一个所述文件数据对应的文件索引;
获取用户输入的检索信息;
从所述检索信息中解析出至少一个检索关键词;
从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引;
确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。
优选地,
在所述获取用户输入的检索信息之后,进一步包括:
获取用户输入的检索条件;
所述从各个所述文件索引中确定与所述至少一个检索关键词对应的目标文件索引,包括:
根据所述检索条件和各个所述检索关键词,确定所述目标文件索引。
优选地,
所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:
根据所述检索条件携带的检索时间,以及各个所述文件索引对应的所述描述信息中的创建时间,从各个所述文件索引中确定出与所述检索时间对应的备选文件索引;
从确定出的所述备选文件索引中确定与所述检索关键词对应的目标文件索引;
优选地,
所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:
根据所述检索条件携带的检索文件类型,以及各个所述文件索引对应的所述描述信息中的创建文件类型,从各个所述文件索引中确定出与所述检索文件类型对应的备选文件索引;
从确定出的所述备选文件索引中确定与所述检索关键词对应的目标文件索引;
优选地,
所述根据所述检索条件和各个所述检索关键词,确定所述目标文件索引,包括:
根据所述检索条件中携带的拼接关系,对各个所述检索关键词进行组合;
根据组合后的所述检索关键词,确定所述目标文件索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮通用软件有限公司,未经浪潮通用软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711441728.8/2.html,转载请声明来源钻瓜专利网。