[发明专利]文件的搜索方法、装置、设备及存储介质在审
| 申请号: | 202010660001.4 | 申请日: | 2020-07-08 |
| 公开(公告)号: | CN111813744A | 公开(公告)日: | 2020-10-23 |
| 发明(设计)人: | 崔凯;刘莉红;刘玉宇 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/14 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 徐进之 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文件 搜索 方法 装置 设备 存储 介质 | ||
本发明涉及文件搜索技术领域,主要涉及区块链技术,揭露了一种文件的搜索方法、装置、设备及存储介质,所述方法包括:获取搜索请求信息,并提取所述搜索请求信息中的预设关键字信息;根据所述预设关键字信息确定所述搜索请求信息的类别信息;根据所述类别信息访问本地的预设索引集合,所述预设索引集合中包含键值对信息;将所述预设关键字信息作为键信息,根据所述键信息从所述键值对信息中查找对应的值;将查找到的值作为搜索结果,从而实现文件的搜索,从而通过本地的预设索引集合,无需通过部署数据库相关的服务即可得到搜索结果,提高文件的搜索效率。
技术领域
本发明涉及文件搜索技术领域,尤其涉及一种文件的搜索方法、装置、设备及存储介质。
背景技术
目前,为了实现文件搜索功能,传统方案主要有两种:基于纯文本文件的搜索和基于(关系型或非关系型)数据库的搜索。其中基于纯文本文件的搜索方案是最直观的,因为这种海量标签搜索的需求中,往往数据规模不会特别大,一般带有10000行标注数据的文本文件大概只有3MB不到的大小,每次要进行标签搜索的时候再打开这个标签文件,读取内容再进行搜索的性能损耗都不算大,然后进行逐行读取匹配;另一个方案是基于数据库的搜索,就是把标签文件的数据全部导入到数据库内,当有搜索请求的时候,直接拼装查询语句进行搜索。
对于基于纯文本文件的搜索的方案,最大的缺陷在于每次搜索都要重新把标签文件打开并读取,然后才能进行搜索,而搜索的过程也是一个没有优化的处理方案,每次都要对标签文件里的每一行进行搜索并匹配,效率较低;基于数据库的搜索方案效率会对比纯文本搜索要高,只需一次导入,后续每次搜索都可以直接利用数据库自带的搜索方案,但其缺陷也比较明显,需要为这个体量不大的标签数据集合额外部署数据库相关的服务,而且每次标签文件有更新,都要重新执行一次导入数据的操作。
发明内容
本发明的主要目的在于提出一种文件的搜索方法、装置、设备及存储介质,旨在提高文件的搜索效率。
为实现上述目的,本发明提供一种文件的搜索方法,所述文件的搜索方法包括以下步骤:
获取搜索请求信息,并提取所述搜索请求信息中的预设关键字信息;
根据所述预设关键字信息确定所述搜索请求信息的类别信息;
根据所述类别信息访问本地的预设索引集合,所述预设索引集合中包含键值对信息,其中,所述预设索引集合存储在区块链中;
将所述预设关键字信息作为键信息,根据所述键信息从所述键值对信息中查找对应的值;
将查找到的值作为搜索结果,从而实现文件的搜索。
可选地,所述预设索引集合包括文件索引;
所述根据所述类别信息访问本地的预设索引集合之前,所述方法还包括:
在所述类别信息为文件类别信息时,获取所述预设索引集合中的文件索引;
所述根据所述类别信息访问本地的预设索引集合,包括:
根据所述文件类别信息访问本地的文件索引。
可选地,所述预设索引集合包括标签索引;
所述根据所述类别信息访问本地的预设索引集合之前,所述方法还包括:
在所述类别信息为标签类别信息时,获取所述预设索引集合中的标签索引;
所述根据所述类别信息访问本地的预设索引集合,包括:
根据所述标签类别信息访问本地的标签索引。
可选地,所述根据所述类别信息访问本地的预设索引集合之前,所述方法还包括:
建立预设字典变量,所述预设字典变量包括键变量信息以及对应的值变量信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010660001.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种环境保护用沙漠固沙装置
- 下一篇:一种基于人脸识别的地铁乘车检票方法





