[发明专利]一种在图像中检测表格线的方法及装置在审
申请号: | 202111134050.5 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113723362A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 龙伟;郭丰俊;丁凯;龙腾 | 申请(专利权)人: | 上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 上海双霆知识产权代理事务所(普通合伙) 31415 | 代理人: | 殷晓雪 |
地址: | 200436 上海市静安区万荣*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 检测 表格 方法 装置 | ||
1.一种在图像中检测表格线的方法,其特征是,包括如下步骤;
步骤S10:将图像输入语义分割网络,获得潜在表格线临近区域像素集合;所述潜在表格线临近区域像素集合是指一些可能存在表格线的区域的孤立的像素点;
步骤S20:对表格线临近区域像素集合进行线段拟合以得到表格线;
步骤S30:根据对图像进行光学字符识别获取的文字行信息,对步骤S20得到的表格线进行过滤,移除虚假表格线,得到真实表格线;
步骤S40:根据表格线之间的位置关系,将所有表格线分别归入各个行、各个列的组别;
步骤S50:根据表格线所属组别构建单元格,并将每一单元格范围内的光学字符识别结果作为该单元格中的文字信息保存,最终得到完整的结构化的电子表格;
步骤S60:如果步骤S50的电子表格结构化失败、并且是由于表格线检测错误导致的,则提取该失败场景的典型特征,并以此生成困难样本,重新训练所述语义分割网络,并利用重新训练后的所述语义分割网络重复步骤S10至步骤S50,直至步骤S50的电子表格结构化成功。
2.根据权利要求1所述的在图像中检测表格线的方法,其特征是,所述步骤S10中,图像的语义分割是对图像中每一个像素点进行分类,确定每个点的类别,从而进行区域划分;所述语义分割网络基于深度学习算法,包括卷积神经网络、深度卷积神经网络、全卷积网络的任意一种或多种。
3.根据权利要求1所述的在图像中检测表格线的方法,其特征是,所述步骤S30中,所述文字行信息包括文字行的高度、单个文字的宽度、文字行的角度的任一种或多种。
4.根据权利要求1所述的在图像中检测表格线的方法,其特征是,所述步骤S40中,对于水平线,按起始端点排序后进行循环处理,遇到垂直距离接近且水平部分有重叠的水平线就进行合并去重,如此将逻辑上属于上同一条水平线但实际被检测为多条的水平线组装为一条水平线;最终,每一表格行的水平线归为一组,组内根据是否有单元格合并情况包含一根或多根水平线;对竖直线的处理采用类似方法。
5.根据权利要求4所述的在图像中检测表格线的方法,其特征是,所述步骤S40中,处理过程使用并查集算法进行加速。
6.根据权利要求1所述的在图像中检测表格线的方法,其特征是,所述步骤S60进一步包括如下子步骤;
步骤S61:准备通用样本合成工具,所述困难样本合成工具具有多个可调整的参数,通过调整这些参数可生成各种特征的样本及标注;
步骤S62:收集并分析由于表格线检测错误造成的电子表格结构化失败的场景下的典型特征;
步骤S63:根据步骤S62得到的失败场景的典型特征,调整通用样本合成工具中的参数以生成具有相同特征的困难样本及标注;
步骤S64:利用所生成的困难样本重新训练用于在图像中获得潜在表格线临近区域像素集合的所述语义分割网络。
7.根据权利要求6所述的在图像中检测表格线的方法,其特征是,所述步骤S61中,所述困难样本合成工具将样本生成过程抽象为基础背景纹理、表格结构、正文内容与样式、表格线位置与样式、图章水印合成这五个部分;基础背景纹理部分的参数包括背景图片、背景颜色、纹理图案、纹理颜色的任一种或多种;表格结构部分的参数包括表格数目、大小、位置、行列数、合并单元格情况的任一种或多种;正文内容与样式部分的参数包括字号、字体、颜色、位置、对齐方式的任一种或多种;表格线位置与样式部分的参数包括表格线的类型风格、粗细、像素区域的任一种或多种;图章水印合成部分的参数包含图章水印的数目、位置、角度、色彩的任一种或多种。
8.根据权利要求6所述的在图像中检测表格线的方法,其特征是,所述步骤S62中,所述失败场景的典型特征包括印刷错位或手写造成的字压线、长笔划汉字纵向重复排列造成的假线、图章遮挡引起的漏线、错误地将图章边缘识别为表格线、强光线拍摄造成表线与背景难区分、复杂纹理样本中通过彩色线或颜色块分隔单元格、使用两根平行线分隔邻接单元格、低矮稠密单元格中很短的表格线识别丢失的任一种或多种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司,未经上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111134050.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食品检测采样装置
- 下一篇:一种车辆后视镜的折叠检测装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序