[发明专利]一种保留原生内容的OCR双层文件生成方法在审
申请号: | 202210109987.5 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114463758A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 瞿欢;陈欣;姬辉;何鹏飞 | 申请(专利权)人: | 南京云档信息科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06N3/04 |
代理公司: | 南京中盟科创知识产权代理事务所(特殊普通合伙) 32279 | 代理人: | 孙丽君 |
地址: | 210000 江苏省南京市栖霞区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 保留 原生 内容 ocr 双层 文件 生成 方法 | ||
1.一种保留原生内容的OCR双层文件生成方法,其特征在于,该方法包括以下步骤:
对原生文件进行计算、光学字符识别及存储;
获取待使用文件,记录文件id;
根据所述文件id与页码,读取对应的光学字符识别结果;
根据用户需求,返回不同类型结果。
2.根据权利要求1所述的一种保留原生内容的OCR双层文件生成方法,其特征在于,所述对原生文件进行计算、光学字符识别及存储包括以下步骤:
从数据库种读取文件id;
按顺序抽取原生文件中的每一个页面;
识别并记录当前页面内容的版式,保存入库;
对当前页面内容进行光学字符识别,保存入库;
合并识别结果与光学字符识别结果;
若原生文件存在下一页,则继续进行页面识别与光学字符识别。
3.根据权利要求2所述的一种保留原生内容的OCR双层文件生成方法,其特征在于,所述当前页面的版式包括当前页面的页码、宽及高。
4.根据权利要求3所述的一种保留原生内容的OCR双层文件生成方法,其特征在于,所述对当前页面内容进行光学字符识别包括以下步骤:
利用场景文字识别算法对当前页面内容进行文字检测;
使用卷积神经网络模型与时序类分类网络模型结合的卷积网络进行当前页面内容的文字识别。
5.根据权利要求4所述的一种保留原生内容的OCR双层文件生成方法,其特征在于,所述利用场景文字识别算法对当前页面内容进行文字检测包括以下步骤:
使用卷积网络模型将当前页面提取四个级别的特征图;
通过上采样、串联及卷积方法进行逐层合并得到合并特征图;
输出单通道的分数特征图和多通道的几何特征图。
6.根据权利要求5所述的一种保留原生内容的OCR双层文件生成方法,其特征在于,所述卷积网络模型包括目标检测模型和视觉几何组模型。
7.根据权利要求6所述的一种保留原生内容的OCR双层文件生成方法,其特征在于,所述四个级别的特征图分别为当前页面大小的1/32、1/16、1/8和1/4。
8.根据权利要求7所述的一种保留原生内容的OCR双层文件生成方法,其特征在于,所述使用卷积神经网络模型与时序类分类网络模型结合的卷积网络进行当前页面内容的文字识别包括以下步骤:
提取特征图中文字区域的特征向量,并生成特征序列;
将特征序列转换为二维特征图输入卷积神经网络模型,获取序列上的上下文关系;
获得最后的标签序列。
9.根据权利要求8所述的一种保留原生内容的OCR双层文件生成方法,其特征在于,所述根据用户需求,返回不同类型结果包括以下步骤:
若需要原生文件,则直接返回;
若需要文字层内容,则返回光学字符识别结果;
若需要双层版式文件,则在原生页面上动态增加透明文字层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京云档信息科技有限公司,未经南京云档信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210109987.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:发动机文丘里管
- 下一篇:应用于量子密钥分发片上系统的相位调制单元
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法