[发明专利]一种在图像中检测表格线的方法及装置在审
申请号: | 202111134050.5 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113723362A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 龙伟;郭丰俊;丁凯;龙腾 | 申请(专利权)人: | 上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 上海双霆知识产权代理事务所(普通合伙) 31415 | 代理人: | 殷晓雪 |
地址: | 200436 上海市静安区万荣*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 检测 表格 方法 装置 | ||
本申请公开了一种在图像中检测表格线的方法。步骤S10:将图像输入语义分割网络,获得潜在表格线临近区域像素集合。步骤S20:对表格线临近区域像素集合进行线段拟合以得到表格线。步骤S30:移除虚假表格线,得到真实表格线。步骤S40:将所有表格线分别归入各个行、各个列的组别。步骤S50:得到完整的结构化的电子表格。步骤S60:如果步骤S50的电子表格结构化失败、并且是由于表格线检测错误导致的,则提取该失败场景的典型特征,并以此生成困难样本,重新训练所述语义分割网络。上述方法通过对语义分割网络的反复训练,提高了表格线检测的准确率,有助于提高电子表格结构化的成功率。
技术领域
本申请涉及一种在图像(图片)中检测表格线的方法。
背景技术
表格在日常生活及办公中有广泛的应用,存在大量将图片中表格转化为电子表格的需求,而此类自动转化技术通常严重依赖于表格线的检测。表格线包括用于分隔表格内部与表格外部的外部边框线、以及在表格内部用于区分行、列的内部分隔线。
因为图像质量、拍摄角度、不均匀的光线、纸张弯曲褶皱、文字区域错位、图章水印干扰以及表格线本身的色彩、粗细、样式的多样性,会给检测表格线带来极大的挑战,进而影响表格的结构还原的准确性。
发明内容
本申请所要解决的技术问题是提出一种在图像中检测表格线的方法,具有准确率高、能够有效地辅助表格结构还原的特点。
为解决上述技术问题,本申请提出的在图像中检测表格线的方法包括如下步骤。步骤S10:将图像输入语义分割网络,获得潜在表格线临近区域像素集合;所述潜在表格线临近区域像素集合是指一些可能存在表格线的区域的孤立的像素点。步骤S20:对表格线临近区域像素集合进行线段拟合以得到表格线。步骤S30:根据对图像进行光学字符识别获取的文字行信息,对步骤S20得到的表格线进行过滤,移除虚假表格线,得到真实表格线。步骤S40:根据表格线之间的位置关系,将所有表格线分别归入各个行、各个列的组别。步骤S50:根据表格线所属组别构建单元格,并将每一单元格范围内的光学字符识别结果作为该单元格中的文字信息保存,最终得到完整的结构化的电子表格。步骤S60:如果步骤S50的电子表格结构化失败、并且是由于表格线检测错误导致的,则提取该失败场景的典型特征,并以此生成困难样本,重新训练所述语义分割网络,并利用重新训练后的所述语义分割网络重复步骤S10至步骤S50,直至步骤S50的电子表格结构化成功。上述方法通过对语义分割网络的反复训练,提高了表格线检测的准确率,有助于提高电子表格结构化的成功率。
进一步地,所述步骤S10中,图像的语义分割是对图像中每一个像素点进行分类,确定每个点的类别,从而进行区域划分;所述语义分割网络基于深度学习算法,包括卷积神经网络、深度卷积神经网络、全卷积网络的任意一种或多种。这是对步骤S10的详细说明。
进一步地,所述步骤S30中,所述文字行信息包括文字行的高度、单个文字的宽度、文字行的角度的任一种或多种。
进一步地,所述步骤S40中,对于水平线,按起始端点排序后进行循环处理,遇到垂直距离接近且水平部分有重叠的水平线就进行合并去重,如此将逻辑上属于上同一条水平线但实际被检测为多条的水平线组装为一条水平线;最终,每一表格行的水平线归为一组,组内根据是否有单元格合并情况包含一根或多根水平线;对竖直线的处理采用类似方法。这是对步骤S40的具体说明。
可选地,所述步骤S40中,处理过程使用并查集算法进行加速。
进一步地,所述步骤S60进一步包括如下子步骤。步骤S61:准备通用样本合成工具,所述困难样本合成工具具有多个可调整的参数,通过调整这些参数可生成各种特征的样本及标注。步骤S62:收集并分析由于表格线检测错误造成的电子表格结构化失败的场景下的典型特征。步骤S63:根据步骤S62得到的失败场景的典型特征,调整通用样本合成工具中的参数以生成具有相同特征的困难样本及标注。步骤S64:利用所生成的困难样本重新训练用于在图像中获得潜在表格线临近区域像素集合的所述语义分割网络。这是对步骤S60的具体说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司,未经上海合合信息科技股份有限公司;上海临冠数据科技有限公司;上海生腾数据科技有限公司;上海盈五蓄数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111134050.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食品检测采样装置
- 下一篇:一种车辆后视镜的折叠检测装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序