[发明专利]在线协同知识库的文档导入方法、装置、存储介质及设备有效

专利信息
申请号: 202010223361.8 申请日: 2020-03-26
公开(公告)号: CN111414331B 公开(公告)日: 2023-08-08
发明(设计)人: 彭龙腾 申请(专利权)人: 北京字节跳动网络技术有限公司
主分类号: G06F16/11 分类号: G06F16/11
代理公司: 北京远智汇知识产权代理有限公司 11659 代理人: 范坤坤
地址: 100041 北京市石景山区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 在线 协同 知识库 文档 导入 方法 装置 存储 介质 设备
【权利要求书】:

1.一种在线协同知识库的文档导入方法,其特征在于,包括:

获取第一在线协同知识库中的预设空间的打包文件;

对所述打包文件进行解析,并获取所述预设空间的文档层级关系信息;

将所述打包文件中包含的原始文档转换为目标格式的目标文档,所述目标格式为满足第二在线协同知识库要求的文档格式;

按照所述文档层级关系信息将所述目标文档挂载至所述第二在线协同知识库中;

所述将所述打包文件中包含的原始文档转换为目标格式的目标文档,包括:

当所述打包文件中包含的原始文档中存在附件时,获取并保存对应的附件内容;

更新所述原始文档与所述附件内容的关联关系,得到经过处理后的原始文档;

将所述经过处理后的原始文档转换为目标格式的目标文档;

所述更新所述原始文档与所述附件内容的关联关系,包括:

将所述原始文档中的附件的链接方式替换成对应的下载地址的超链接方式。

2.根据权利要求1所述的方法,其特征在于,在所述获取并保存对应的附件内容之后,还包括:

记录所保存的附件内容对应的下载地址。

3.根据权利要求1所述的方法,其特征在于,所述当所述打包文件中包含的原始文档中存在附件时,获取并保存对应的附件内容,包括:

扫描所述打包文件中包含的原始文档中插入的附件;

在扫描到附件时,获取所扫描到的附件的属性信息,并记录所述原始文档和所述属性信息的映射关系,其中,所述属性信息包括存储路径和名称;

依据所述映射关系获取并保存所述原始文档对应的附件内容。

4.根据权利要求3所述的方法,其特征在于,所述扫描所述打包文件中包含的原始文档中插入的附件,包括:

利用第一预设正则表达式扫描所述打包文件中包含的原始文档中插入的附件,其中,所述第一预设正则表达式依据所述原始文档的页面布局规律确定。

5.根据权利要求1所述的方法,其特征在于,在所述将所述打包文件中包含的原始文档转换为目标格式的目标文档之前,还包括:

在预设数据库中创建所述打包文件中包含的原始文档对应的处理任务,并初始化所述处理任务的任务状态;

在将所述打包文件中包含的原始文档转换为目标格式的目标文档的过程中,根据当前处理阶段的处理结果对所述任务状态进行更新;

当检测到所述处理任务出现异常时,从当前任务状态对应的处理阶段开始重新启动所述处理任务。

6.根据权利要求1-5任一所述的方法,其特征在于,在所述获取第一在线协同知识库中的预设空间的打包文件之前,还包括:

获取第二在线协同知识库中的目标目录节点;

相应的,所述按照所述文档层级关系信息将所述目标文档挂载至所述第二在线协同知识库中,包括:

按照所述文档层级关系信息将所述目标文档挂载至所述目标目录节点下。

7.一种在线协同知识库的文档导入装置,其特征在于,包括:

打包文件获取模块,用于获取第一在线协同知识库中的预设空间的打包文件;

层级关系获取模块,用于对所述打包文件进行解析,并获取所述预设空间的文档层级关系信息;

文档转换模块,用于将所述打包文件中包含的原始文档转换为目标格式的目标文档,所述目标格式为满足第二在线协同知识库要求的文档格式;

文档挂载模块,用于按照所述文档层级关系信息将所述目标文档挂载至所述第二在线协同知识库中;

所述文档转换模块,还用于当所述打包文件中包含的原始文档中存在附件时,获取并保存对应的附件内容;

更新所述原始文档与所述附件内容的关联关系,得到经过处理后的原始文档;

将所述经过处理后的原始文档转换为目标格式的目标文档;

所述更新所述原始文档与所述附件内容的关联关系,包括:

将所述原始文档中的附件的链接方式替换成对应的下载地址的超链接方式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010223361.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top