[发明专利]PDF文档拆分方法、装置、设备及存储介质在审
申请号: | 202210939980.6 | 申请日: | 2022-08-05 |
公开(公告)号: | CN115270723A | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 陈忠玉 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06F40/137 | 分类号: | G06F40/137;G06F40/154;G06F40/205;G06F16/903 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 郑永敏 |
地址: | 518000 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本申请提供一种PDF文档拆分方法、装置、设备及存储介质,该方法包括获取待处理文档,并基于对所述待处理文档的解析结果,获得所述待处理文档中各行文档内容对应的行标签;基于所述各行文档内容对应的行标签以及预设分割层级对应的正则表达式,确定所述各行文档内容对应的各个分割层级;基于所述各行文档内容对应的各个分割层级,对所述待处理文档进行拆分,获得至少一个拆分数据。本申请涉及数据处理领域,通过行标签和正则表达式的匹配,以及正则表达式对应的分割层级,依次对待处理文档进行拆分,能够在拆分过程中保留拆分数据在待处理文档中的顺序和层级关系,从而提高文档拆分质量。 | ||
搜索关键词: | pdf 文档 拆分 方法 装置 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210939980.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种氧化锌脱硫剂回收利用的方法及应用
- 下一篇:一种POE胶膜