[发明专利]适用于网盘文档的索引创建方法、装置、网盘及存储介质有效
申请号: | 202210335974.X | 申请日: | 2022-04-01 |
公开(公告)号: | CN114416670B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 岳晨 | 申请(专利权)人: | 天津联想协同科技有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/14;G06F16/13 |
代理公司: | 天津合正知识产权代理有限公司 12229 | 代理人: | 吕琦 |
地址: | 300000 天津市滨海新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 适用于 文档 索引 创建 方法 装置 存储 介质 | ||
1.一种适用于网盘文档的索引创建方法,其特征在于,包括:
创建至少两个索引服务,所述至少两个索引服务被配置为不同的文档索引处理能力,且分别对应不同大小的文档,且至少两个索引服务之间的文档索引处理能力为倍数关系;
在文档变化时,获取所述文档的大小;
在所述文档的大小超过预设的大小阈值时,将所述文档进行拆分,生成多个子文档;
根据所述文档的编号为所述多个子文档分别建立子编号;
分别对所述多个子文档进行解析,根据解析结果为所述多个子文档分别建立ES索引,并根据所述子编号进行去重,将去重后的结果作为所述文档的ES索引。
2.根据权利要求1所述的适用于网盘文档的索引创建方法,其特征在于,所述将所述文档进行拆分包括:
根据所述文档的大小和索引服务的文档索引处理能力对所述文档进行拆分,以使得所述文档索引处理能力与拆分后的文档大小相适应。
3.根据权利要求2所述的适用于网盘文档的索引创建方法,其特征在于,所述方法还包括:
判断所述文档是否为协同编辑文档;
所述在所述文档的大小超过预设的大小阈值时,将所述文档进行拆分,生成多个子文档,包括:
在所述协同编辑文档的大小超过预设的大小阈值时,将所述协同编辑文档按照协同编辑区域对应的最大文档大小进行拆分;
相应的,所述方法还包括:
对所述至少两个索引服务进行优化配置,以使得新增索引服务,并实现每个索引服务与协同编辑区域对应的最大文档大小相一致。
4.根据权利要求3所述的适用于网盘文档的索引创建方法,其特征在于,所述方法还包括:
记录所述文档的修改内容所对应的变化子文档,利用优化配置后的索引服务对变化子文档进行解析,并根据解析结果为变化子文档分别建立ES索引。
5.根据权利要求2所述的适用于网盘文档的索引创建方法,其特征在于,所述文档变化包括:
新建文档或者修改文档保存。
6.根据权利要求1所述的适用于网盘文档的索引创建方法,其特征在于,所述在文档变化时,获取所述文档的大小包括:
利用索引文件消费者订阅通知查看订阅更新文档变化消息;
根据所述文档变化消息采用流式下载方式获取文档,获取所述文档的属性,根据所述文档的属性获取文档的大小。
7.根据权利要求6所述的适用于网盘文档的索引创建方法,其特征在于,文档的属性包括:
标题、标签、文件大小和/或路径。
8.根据权利要求7所述的适用于网盘文档的索引创建方法,其特征在于,所述根据解析结果为所述多个子文档分别建立ES索引,包括:
分别将每个子文档的ES索引和所述文档的属性作为索引文件内容分别索引到ES中。
9.根据权利要求8所述的适用于网盘文档的索引创建方法,其特征在于,所述适用于网盘文档的索引创建方法还包括:
在所述文档属性中的标题、标签和路径发生变化时,修改索引文件中的文档的属性。
10.一种适用于网盘文档的索引创建装置,其特征在于,包括:
创建模块,用于创建至少两个索引服务,所述至少两个索引服务被配置为不同的文档索引处理能力,且对应不同分别对应不同大小的文档,且至少两个索引服务之间的文档索引处理能力为倍数关系;
获取模块,用于在文档变化时,获取所述文档的大小;
拆分模块,用于在所述文档的大小超过预设的大小阈值时,将所述文档进行拆分,生成多个子文档;
建立模块,用于根据所述文档的编号为所述多个子文档分别建立子编号;
解析模块,用于分别对所述多个子文档进行解析,根据解析结果为所述多个子文档分别建立ES索引,并根据所述子编号进行去重,将去重后的结果作为所述文档的ES索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津联想协同科技有限公司,未经天津联想协同科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210335974.X/1.html,转载请声明来源钻瓜专利网。