[发明专利]一种文档在线可视化拆分以及自动合并的方法、系统在审
申请号: | 201810213267.7 | 申请日: | 2018-03-15 |
公开(公告)号: | CN108491492A | 公开(公告)日: | 2018-09-04 |
发明(设计)人: | 罗伟峰 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种文档在线可视化处理方法,所述方法整体上包括如下步骤:文档上传、文档解析、文档转换、格式文档处理以及文档拆分步骤;还包括文档还原步骤:根据所述至少一个拆分控制点将拆分后的文档进行合并。和现有技术不同,本申请的文档拆分和还原集合成一体,因此,还原过程,即合并将充分考虑拆分过程考虑的因素,例如标记/结构化元素等,从而保证原文档的结构不发生改变。本发明还提供文档在线可视化处理系统,包括正则化处理模块,所述正则化处理模块对所述文档转换器输出的文档进行正则化处理,通过所述正则化处理,以实现前述文档在线可视化处理方法。 | ||
搜索关键词: | 文档 正则化处理 可视化处理 可视化处理系统 结构化元素 文档转换器 格式文档 还原步骤 还原过程 文档解析 文档上传 文档转换 自动合并 合并 可视化 还原 原文 集合 输出 申请 保证 | ||
【主权项】:
1.一种文档在线可视化处理方法,所述方法包括如下步骤:(1)文档上传步骤:用户上传需要处理的文档;(2)文档解析步骤:对所述文档进行整体的通篇分析,标记出文档中的文字段落以及其他特殊结构;(3)文档转换步骤:将所述文档转换成浏览器可直接在线显示的格式;(4)格式文档处理步骤:对所述转换后的文档进行字符串处理;(5)文档拆分步骤:基于所述字符串处理的结果以及用户输入的拆分要求,对所述文档进行拆分操作;其特征在于:所述步骤(4)中的所述字符串处理,包括:整理所述转换后的文档的每一个文字段落的字数信息以及其他特殊结构的属性信息;所述步骤(5)中的所述文档拆分步骤,进一步包括,得到至少一个拆分控制点,并在原文档中标记出所述至少一个拆分控制点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810213267.7/,转载请声明来源钻瓜专利网。
- 上一篇:智能客服知识图谱的构建方法与系统
- 下一篇:一种雷达空情数据过滤方法