[发明专利]融合多种文本特征及几何信息的表格识别方法及系统有效
| 申请号: | 202010663170.3 | 申请日: | 2020-07-10 |
| 公开(公告)号: | CN111860257B | 公开(公告)日: | 2022-11-11 |
| 发明(设计)人: | 李一仁;黄征;周异;陈凯 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/413;G06V20/62;G06V10/82;G06V30/10 |
| 代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种融合多种文本特征及几何信息的表格识别方法,包括:数据处理步骤:获取表格区域的图片,分别对获取的图片进行OCR识别与直线识别,获得关键特征信息;图卷积神经网络训练步骤:根据获得的关键特征信息,进行图卷积神经网络训练,构建表格结构识别模型;表格识别步骤:根据构建的表格结构识别模型,对图片格式的表格进行结构识别。本发明提出了一种融合多种文本特征及几何信息的表格识别方法,从采用数据的多样性方面和对数据进行特征提取的方法等方面进行改进,有效提升了表格识别的准确率,获得了更加准确的表格结构重建结果,相对现有基于传统规则的表格识别机制及基于图片的传统深度学习方法有了很大的提升效果。 | ||
| 搜索关键词: | 融合 多种 文本 特征 几何 信息 表格 识别 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010663170.3/,转载请声明来源钻瓜专利网。





