[发明专利]基于深度学习的表格线检测方法、装置、终端、存储介质在审
| 申请号: | 201911038212.8 | 申请日: | 2019-10-29 |
| 公开(公告)号: | CN110807404A | 公开(公告)日: | 2020-02-18 |
| 发明(设计)人: | 周康明;胡威 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 倪静 |
| 地址: | 200032 上海市徐汇*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 表格 检测 方法 装置 终端 存储 介质 | ||
1.一种基于深度学习的表格线检测方法,其特征在于,包括:
对数据表格图像集进行图像预处理,以形成滤除了图像污染并计算了线条交点的位置数据的训练样本集;
利用分割网络模型对所述训练样本集中的样本图像进行图像分割;
在通过连通域检测算法检测图像分割结果合格的情况下,基于所述线条交点的位置数据分别提取表格的竖直线和水平线。
2.根据权利要求1所述的方法,其特征在于,所述对数据表格图像集进行图像预处理,包括:
对数据表格图像集中的图像进行灰度阈值化,据以生成对应的灰度图像;
对所述灰度图像进行边缘检测,据以生成对应的边缘二值图像;
对所述边缘二值图像进行霍夫变换,据以计算两条或多条直线的交点的位置数据。
3.根据权利要求1所述的方法,其特征在于,所述利用分割网络模型对所述训练样本集中的样本图像进行图像分割,包括:
将预处理后的数据表格图像中的线条和交点按照表格属性进行分类;
利用PSPNet分割网络模型对各类图像进行训练分割,并基于MIOU值来衡量分割效果。
4.根据权利要求3所述的方法,其特征在于,所述方法包括:
将预处理后的数据表格图像中的线条和交点按照表格属性分为水平直线类、竖直线类、交点类、或者背景类。
5.根据权利要求1所述的方法,其特征在于,所述方法包括:
通过连通域检测算法检测图像分割结果是否合格;
若合格,则基于所述线条交点的位置数据分别提取表格的竖直线和水平线;
若不合格,则将分割结果不合格的数据表格图像加入训练样本集中,并重新利用分割网络模型对分割结果不合格的数据表格图像进行图像分割。
6.根据权利要求5所述的方法,其特征在于,所述方法包括:
基于连通域检测算法检测图像分割结果是否满足线条的连续性要求;
若满足线条的连续性要求,则确定为分割结果合格;
若不满足线条的连续性要求,则在对图像进行图像膨胀和/或图像腐蚀操作后继续检测图像分割结果是否满足线条的连续性要求;
若仍不满足线条的连续性要求,则确定为图像分割结果不合格。
7.一种数据表格图像的线条检测装置,其特征在于,包括:
图像预处理模块,用于对数据表格图像集进行图像预处理,以形成滤除了图像污染并计算了线条交点的位置数据的训练样本集;
图像分割模块,用于利用分割网络模型对所述训练样本集中的样本图像进行图像分割;
线条检测模块,用于在通过连通域检测算法检测图像分割结果合格的情况下,基于所述线条交点的位置数据分别提取表格的竖直线和水平线。
8.根据权利要求7所述的装置,其特征在于,所述预处理模块包括:
灰度处理模块,用于对数据表格图像集中的图像进行灰度阈值化,据以生成对应的灰度图像;
边缘检测模块,用于对所述灰度图像进行边缘检测,据以生成对应的边缘二值图像;
变换模块,用于对所述边缘二值图像进行霍夫变换,据以计算两条或多条直线的交点的位置数据。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述基于深度学习的表格线检测方法。
10.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求1至6中任一项所述基于深度学习的表格线检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911038212.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种流致振动组合发电装置
- 下一篇:间叔丁基苯酚的合成方法





