[发明专利]一种PDF文件向OFD文件转化的方法有效
申请号: | 201810131230.X | 申请日: | 2018-02-09 |
公开(公告)号: | CN108415887B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 陆伟;于丰畅;程齐凯 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F40/151 | 分类号: | G06F40/151;G06F40/189;G06F16/11 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种PDF文件向OFD文件转化的方法,首先输入PDF文件;然后利用机器视觉技术对PDF文件进行版面分析,得到版面的内容分布,再解析PDF文件数据,获得该文件中的所有元素的对象,以及对象信息;然后将对象与版面分布进行映射,定位文字、图片、表格、公式等元素,接着利用映射之后的对象信息,将PDF的对象转化为OFD格式的对象;最后将OFD对象按照输出要求进行排版,并输出OFD文件。本发明能够以较高的正确率自动将单个或批量PDF文件转换为OFD文件,并且有效地保证了PDF文件中的图片、表格、公式等特殊元素的正确性。降低了储存在PDF文件中的信息的使用难度,提高了PDF文件向OFD文件的转换效率。 | ||
搜索关键词: | 一种 pdf 文件 ofd 转化 方法 | ||
【主权项】:
1.一种PDF文件向OFD文件转化的方法,其特征在于,包括以下步骤:步骤1:输入PDF文件;步骤2:对PDF文件进行版面分析,得到内容版块的分布;步骤3:解析PDF文件数据,获得该文件中的所有元素的对象,以及所有对象的信息;步骤4:将元素对象和内容版块进行映射,并定位元素对象的位置,得到PDF文件元素和内容板块的隶属关系;步骤5:利用对象信息,将映射之后的PDF对象转化为OFD格式的对象;步骤6:将OFD对象按照输出要求进行排版,并输出OFD文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810131230.X/,转载请声明来源钻瓜专利网。