[发明专利]适用于网盘文档的索引创建方法、装置、网盘及存储介质有效
申请号: | 202210335974.X | 申请日: | 2022-04-01 |
公开(公告)号: | CN114416670B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 岳晨 | 申请(专利权)人: | 天津联想协同科技有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/14;G06F16/13 |
代理公司: | 天津合正知识产权代理有限公司 12229 | 代理人: | 吕琦 |
地址: | 300000 天津市滨海新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 适用于 文档 索引 创建 方法 装置 存储 介质 | ||
本发明实施例公开了一种适用于网盘文档的索引创建方法、装置、网盘及存储介质。其中,所述方法包括:在文档变化时,获取所述文档的大小;在所述文档的大小超过预设的大小阈值时,将所述文档进行拆分,生成多个子文档;根据所述文档的编号为所述多个子文档分别建立子编号;分别对所述多个子文档进行解析,根据解析结果为所述多个子文档分别建立ES索引,并根据所述子编号进行去重,将去重后的结果作为所述文档的ES索引。能够使得各个ES索引服务能够快速处理各个子文档,减少对于内存的长时间占用,提升ES索引服务性能。并且减少了索引时长,可快速相应高亮显示,提升用户使用体验。
技术领域
本发明涉及网盘技术领域,尤其涉及一种适用于网盘文档的索引创建方法、装置、网盘及存储介质。
背景技术
网盘,是由互联网公司推出的在线存储服务。网盘系统机房为用户划分一定的磁盘空间,为用户免费或收费提供文件的存储、访问、备份、共享等文件管理等功能,并且拥有高级的世界各地的容灾备份。用户可以把网盘看成一个放在网络上的硬盘或U盘,不管是在家中、单位或其它任何地方,只要连接到因特网,就可以实现管理、编辑网盘里的文件。不需要随身携带,更不怕丢失。对于企业网盘来说,其中所包含的文档数量处于海量级别,为便于用户查找文档,目前网盘通常提供ES(ElasticSearch)索引服务。Elasticsearch是面向文档型数据库,支持分布式实时文件存储,并将每一个字段都编入索引,使其可以被搜索。同时可以扩展到上百台服务器,便于处理PB级别的结构化或非结构化数据。
在实现本发明的过程中,发明人发现如下技术问题:对于海量文件的搜索引擎来说, 如果某些文档非常大, 会造成很多性能问题, 在对大尺寸文档进行索引时, 单次网络传输的内容过多, 不仅对网络压力大,而且失败的概率较高。同时,对大文档进行索引时,会占用大量的内存。特别是ES更新的原理是先删再加, 而大文档更新会临时占用大量内存。导致ES稳定性变差。并且在进行高亮显示帮助用户快速定位搜索内容时,会解析原始文档内容, 大文档势必会降低高亮的速度, 而降低整体的搜索性能。
发明内容
本发明提供一种适用于网盘文档的索引创建方法、装置、网盘及存储介质,以解决现有技术中网盘账号跨网段登录影响网盘性能的技术问题。
第一方面,本发明提供了一种适用于网盘文档的索引创建方法,包括:
在文档变化时,获取所述文档的大小;
在所述文档的大小超过预设的大小阈值时,将所述文档进行拆分,生成多个子文档;
根据所述文档的编号为所述多个子文档分别建立子编号;
分别对所述多个子文档进行解析,根据解析结果为所述多个子文档分别建立ES索引,并根据所述子编号进行去重,将去重后的结果作为所述文档的ES索引。
第二方面,本发明还提供了一种适用于网盘文档的索引创建装置,包括:
获取模块,用于在文档变化时,获取所述文档的大小;
拆分模块,用于在所述文档的大小超过预设的大小阈值时,将所述文档进行拆分,生成多个子文档;
建立模块,用于根据所述文档的编号为所述多个子文档分别建立子编号;
解析模块,用于分别对所述多个子文档进行解析,根据解析结果为所述多个子文档分别建立ES索引,并根据所述子编号进行去重,将去重后的结果作为所述文档的ES索引。
第三方面,本发明还提供了一种网盘,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述提供的适用于网盘文档的索引创建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津联想协同科技有限公司,未经天津联想协同科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210335974.X/2.html,转载请声明来源钻瓜专利网。