[发明专利]表格提取方法与表格提取系统在审
申请号: | 202210364491.2 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114663897A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 路浩南 | 申请(专利权)人: | 贝壳找房网(北京)信息技术有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V20/62;G06V10/26;G06V30/148;G06V30/10 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 王晓晓 |
地址: | 101520 北京市密云区经济开发区兴盛南路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及图像处理技术领域,公开一种表格提取方法与系统。所述方法包括:通过图像分割模型对表格图像进行分割,以获得标记有各个像素点处的线属性的掩膜图像;采用图像学方法对掩膜图像进行处理,以获取每个单元格的顶点坐标、起始行索引、起始列索引、终止行索引与终止列索引;通过文本识别模型对表格图像进行识别,以获得每个文本的最小外接矩形的顶点坐标与文本内容;根据每个单元格的顶点坐标与每个文本的最小外接矩形的顶点坐标,确定每个单元格内的文本内容;以及根据上述行索引与列索引及文本内容,生成以目标文件呈现的表格。本发明在表格印刷的不清楚或噪音干扰较大的情况下,仍可精准地提取任何版式的表格。 | ||
搜索关键词: | 表格 提取 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房网(北京)信息技术有限公司,未经贝壳找房网(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210364491.2/,转载请声明来源钻瓜专利网。