[发明专利]一种在图像中检测表格线的方法及装置在审

专利信息
申请号: 202111134050.5 申请日: 2021-09-27
公开(公告)号: CN113723362A 公开(公告)日: 2021-11-30
发明(设计)人: 龙伟;郭丰俊;丁凯;龙腾 申请(专利权)人: 上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06K9/34;G06N3/04;G06N3/08
代理公司: 上海双霆知识产权代理事务所(普通合伙) 31415 代理人: 殷晓雪
地址: 200436 上海市静安区万荣*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 检测 表格 方法 装置
【说明书】:

本申请公开了一种在图像中检测表格线的方法。步骤S10:将图像输入语义分割网络,获得潜在表格线临近区域像素集合。步骤S20:对表格线临近区域像素集合进行线段拟合以得到表格线。步骤S30:移除虚假表格线,得到真实表格线。步骤S40:将所有表格线分别归入各个行、各个列的组别。步骤S50:得到完整的结构化的电子表格。步骤S60:如果步骤S50的电子表格结构化失败、并且是由于表格线检测错误导致的,则提取该失败场景的典型特征,并以此生成困难样本,重新训练所述语义分割网络。上述方法通过对语义分割网络的反复训练,提高了表格线检测的准确率,有助于提高电子表格结构化的成功率。

技术领域

本申请涉及一种在图像(图片)中检测表格线的方法。

背景技术

表格在日常生活及办公中有广泛的应用,存在大量将图片中表格转化为电子表格的需求,而此类自动转化技术通常严重依赖于表格线的检测。表格线包括用于分隔表格内部与表格外部的外部边框线、以及在表格内部用于区分行、列的内部分隔线。

因为图像质量、拍摄角度、不均匀的光线、纸张弯曲褶皱、文字区域错位、图章水印干扰以及表格线本身的色彩、粗细、样式的多样性,会给检测表格线带来极大的挑战,进而影响表格的结构还原的准确性。

发明内容

本申请所要解决的技术问题是提出一种在图像中检测表格线的方法,具有准确率高、能够有效地辅助表格结构还原的特点。

为解决上述技术问题,本申请提出的在图像中检测表格线的方法包括如下步骤。步骤S10:将图像输入语义分割网络,获得潜在表格线临近区域像素集合;所述潜在表格线临近区域像素集合是指一些可能存在表格线的区域的孤立的像素点。步骤S20:对表格线临近区域像素集合进行线段拟合以得到表格线。步骤S30:根据对图像进行光学字符识别获取的文字行信息,对步骤S20得到的表格线进行过滤,移除虚假表格线,得到真实表格线。步骤S40:根据表格线之间的位置关系,将所有表格线分别归入各个行、各个列的组别。步骤S50:根据表格线所属组别构建单元格,并将每一单元格范围内的光学字符识别结果作为该单元格中的文字信息保存,最终得到完整的结构化的电子表格。步骤S60:如果步骤S50的电子表格结构化失败、并且是由于表格线检测错误导致的,则提取该失败场景的典型特征,并以此生成困难样本,重新训练所述语义分割网络,并利用重新训练后的所述语义分割网络重复步骤S10至步骤S50,直至步骤S50的电子表格结构化成功。上述方法通过对语义分割网络的反复训练,提高了表格线检测的准确率,有助于提高电子表格结构化的成功率。

进一步地,所述步骤S10中,图像的语义分割是对图像中每一个像素点进行分类,确定每个点的类别,从而进行区域划分;所述语义分割网络基于深度学习算法,包括卷积神经网络、深度卷积神经网络、全卷积网络的任意一种或多种。这是对步骤S10的详细说明。

进一步地,所述步骤S30中,所述文字行信息包括文字行的高度、单个文字的宽度、文字行的角度的任一种或多种。

进一步地,所述步骤S40中,对于水平线,按起始端点排序后进行循环处理,遇到垂直距离接近且水平部分有重叠的水平线就进行合并去重,如此将逻辑上属于上同一条水平线但实际被检测为多条的水平线组装为一条水平线;最终,每一表格行的水平线归为一组,组内根据是否有单元格合并情况包含一根或多根水平线;对竖直线的处理采用类似方法。这是对步骤S40的具体说明。

可选地,所述步骤S40中,处理过程使用并查集算法进行加速。

进一步地,所述步骤S60进一步包括如下子步骤。步骤S61:准备通用样本合成工具,所述困难样本合成工具具有多个可调整的参数,通过调整这些参数可生成各种特征的样本及标注。步骤S62:收集并分析由于表格线检测错误造成的电子表格结构化失败的场景下的典型特征。步骤S63:根据步骤S62得到的失败场景的典型特征,调整通用样本合成工具中的参数以生成具有相同特征的困难样本及标注。步骤S64:利用所生成的困难样本重新训练用于在图像中获得潜在表格线临近区域像素集合的所述语义分割网络。这是对步骤S60的具体说明。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司,未经上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111134050.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top