[发明专利]文件的搜索方法、装置、设备及存储介质在审

申请号：	202010660001.4	申请日：	2020-07-08
公开（公告）号：	CN111813744A	公开（公告）日：	2020-10-23
发明（设计）人：	崔凯;刘莉红;刘玉宇	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F16/13	分类号：	G06F16/13;G06F16/14
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	徐进之
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文件搜索方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及文件搜索技术领域，主要涉及区块链技术，揭露了一种文件的搜索方法、装置、设备及存储介质，所述方法包括：获取搜索请求信息，并提取所述搜索请求信息中的预设关键字信息；根据所述预设关键字信息确定所述搜索请求信息的类别信息；根据所述类别信息访问本地的预设索引集合，所述预设索引集合中包含键值对信息；将所述预设关键字信息作为键信息，根据所述键信息从所述键值对信息中查找对应的值；将查找到的值作为搜索结果，从而实现文件的搜索，从而通过本地的预设索引集合，无需通过部署数据库相关的服务即可得到搜索结果，提高文件的搜索效率。

技术领域

本发明涉及文件搜索技术领域，尤其涉及一种文件的搜索方法、装置、设备及存储介质。

背景技术

目前，为了实现文件搜索功能，传统方案主要有两种：基于纯文本文件的搜索和基于(关系型或非关系型)数据库的搜索。其中基于纯文本文件的搜索方案是最直观的，因为这种海量标签搜索的需求中，往往数据规模不会特别大，一般带有10000行标注数据的文本文件大概只有3MB不到的大小，每次要进行标签搜索的时候再打开这个标签文件，读取内容再进行搜索的性能损耗都不算大，然后进行逐行读取匹配；另一个方案是基于数据库的搜索，就是把标签文件的数据全部导入到数据库内，当有搜索请求的时候，直接拼装查询语句进行搜索。

对于基于纯文本文件的搜索的方案，最大的缺陷在于每次搜索都要重新把标签文件打开并读取，然后才能进行搜索，而搜索的过程也是一个没有优化的处理方案，每次都要对标签文件里的每一行进行搜索并匹配，效率较低；基于数据库的搜索方案效率会对比纯文本搜索要高，只需一次导入，后续每次搜索都可以直接利用数据库自带的搜索方案，但其缺陷也比较明显，需要为这个体量不大的标签数据集合额外部署数据库相关的服务，而且每次标签文件有更新，都要重新执行一次导入数据的操作。

发明内容

本发明的主要目的在于提出一种文件的搜索方法、装置、设备及存储介质，旨在提高文件的搜索效率。

为实现上述目的，本发明提供一种文件的搜索方法，所述文件的搜索方法包括以下步骤：

获取搜索请求信息，并提取所述搜索请求信息中的预设关键字信息；

根据所述预设关键字信息确定所述搜索请求信息的类别信息；

根据所述类别信息访问本地的预设索引集合，所述预设索引集合中包含键值对信息，其中，所述预设索引集合存储在区块链中；

将所述预设关键字信息作为键信息，根据所述键信息从所述键值对信息中查找对应的值；

将查找到的值作为搜索结果，从而实现文件的搜索。

可选地，所述预设索引集合包括文件索引；

所述根据所述类别信息访问本地的预设索引集合之前，所述方法还包括：

在所述类别信息为文件类别信息时，获取所述预设索引集合中的文件索引；

所述根据所述类别信息访问本地的预设索引集合，包括：