[发明专利]一种双层PDF批量生成WORD的方法在审

申请号：	201711245886.6	申请日：	2017-12-01
公开（公告）号：	CN109871516A	公开（公告）日：	2019-06-11
发明（设计）人：	陈伟;曹勇;殷绪成;王旭	申请（专利权）人：	江苏奥博洋信息技术有限公司
主分类号：	G06F17/22	分类号：	G06F17/22
代理公司：	暂无信息	代理人：	暂无信息
地址：	212000 江苏省***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	录入坐标信息数据处理还原存储数据信息排版效率数据录入数据信息批量化碎片化记录排版算法校检粘贴转化匹配切割复制图片学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种双层PDF批量生成WORD的方法，其特征在于：所述的PDF批量生成WORD的方法包含以下步骤：步骤(1)、将图片进行碎片化，利用OCR技术对图片进行切割，并记录碎片坐标：

步骤(2)、在录入平台上进行录入，并对录入结果进行比较、校检和抽检；

步骤(3)、把记录碎片的坐标信息进行数据处理，转化为存储数据信息的数据表，方便对数据进一步操作；

步骤(4)、把录入结果和碎片对应的坐标信息进行一一匹配，得到完整的数据信息；

通过上述步骤（3）中得到的数据表，让存储录入结果的数据表和其进行精确匹配，得到既有文字又有坐标信息的新的数据表；

步骤(5)、通过规律和算法，还原文字的位置，生成WORD文件；

根据上述步骤（4）中得到的新的数据表，对文字进行排序以及算法上的处理，使其按照原稿上文字一一排序；再经过坐标上的算法和规律，还原原稿中每列的数据，最后通过碎片图片名还原每张稿子对应着的数据，即可实现快速批量生成WORD文件。

2.根据权利要求1所述的一种双层PDF批量生成WORD的方法，其特征在于：所述的步骤(1)中OCR技术的具体方法为：首先定位文字区域,进而识别文字的行数和列数，确定每个文字所在的矩形块；然后在人工干预下，调整矩形块的大小以及位置，得到更精准的文字矩形块，最后切割成一个个碎片图。

3.根据权利要求1所述的一种双层PDF批量生成WORD的方法，其特征在于：所述的步骤(3)中数据表的生成过程为：通过代码读取到记录坐标信息的TXT文件，把读取的信息复制粘贴到Excel中，经过一系列的分列以及替换等过程，得到主要信息的数据表。

4.根据权利要求1所述的一种双层PDF批量生成WORD的方法，其特征在于：所述的步骤(5)中对文字进行排序的步骤为：步骤(5-1)、通过对碎片名和横纵坐标的排序，得到所有单个文字的排列顺序；

步骤(5-2)、再通过碎片名进行加以区分，把一列数据转换成一行行完整的数据；

步骤(5-3)、再最后利用代码进行控制，最终可批量生成多个WORD文件，即一张大原图对应一个WORD文件。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江苏奥博洋信息技术有限公司，未经江苏奥博洋信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201711245886.6/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载