[发明专利]一种无线框表格图像表格结构识别方法在审
申请号: | 202111672896.4 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114529922A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 梁俊杰;曾令国;缪小勇;邹伟军;魏海波;杨词慧 | 申请(专利权)人: | 上海致宇信息技术有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V10/50;G06V10/36;G06K9/00 |
代理公司: | 上海愉腾专利代理事务所(普通合伙) 31306 | 代理人: | 唐海波 |
地址: | 200433 上海市杨*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 无线 表格 图像 结构 识别 方法 | ||
1.一种无线框表格图像表格结构识别方法,所述方法包括步骤:获取图像;对图像进行处理转换为灰度图像;其特征在于,所述方法还包括以下步骤:
将灰度图像单行的像素点的像素值累加,得到灰度图像的行投影;
将灰度图像单列的像素点的像素值累加,得到灰度图像的列投影;
对行投影进行扫描获得行波峰和行波谷;
对列投影进行扫描获得列波峰和列波谷;
根据行波谷和列波谷计算表格线位置得到表格结构。
2.根据权利要求1所述的无线框表格图像表格结构识别方法,其特征在于,所述根据行波谷和列波谷计算表格线位置得到表格结构包括以下步骤:
过行波谷的中点画水平线,过列波谷的中点画垂直线;所有水平线的集合形成水平线集,所有垂直线的集合形成垂直线集;
每一条水平线与每一条垂直线相交得到一个交点,设置一个点集,包含所有交点;
将水平线集第一条线段和垂直线集第一条线段的交点作为左上角,将水平线集第一条线段和垂直线集最后一条线段的交点作为右上角,将水平线集最后一条线段和垂直线集第一条线段的交点作为左下角,将水平线集最后一条线段和垂直线集最后一条线段的交点作为右下角,生成表格结构。
3.根据权利要求1所述的无线框表格图像表格结构识别方法,其特征在于,所述对行投影进行扫描获得行波峰和行波谷包括:对行投影逐行进行扫描,根据行投影值的大小,将行投影值小于第一阈值的连续区间作为行波谷,除了行波谷的其他区域作为行波峰。
4.根据权利要求1所述的无线框表格图像表格结构识别方法,其特征在于,所述对列投影进行扫描获得列波峰和列波谷包括:对列投影逐列进行扫描,根据列投影值的大小,将列投影值小于第二阈值的连续区间作为列波谷,除了列波谷的其他区域作为列波峰。
5.根据权利要求1所述的无线框表格图像表格结构识别方法,其特征在于,所述方法包括:在步骤对行投影进行扫描获得行波峰和行波谷执行后,再次对杭波峰和行波谷分别进行扫描获得二次杭波峰和二次行波谷,将二次行波谷作为计算表格线位置得到表格结构的依据。
6.根据权利要求5所述的无线框表格图像表格结构识别方法,其特征在于,所述对杭波峰和行波谷分别进行扫描获得二次杭波峰和二次行波谷包括以下步骤:
在行波峰的基础上,以范围最小的行波峰为行波峰单位;
对一个行波峰从行波峰单位开始以上下各固定个像素点为扫描框进行扫描;
若扫描框中的行波峰的灰度值的平均值小于这一个行波峰的灰度值的平均值,则认为扫描框中的行波峰属于二次行波谷部分,得到一个二次行波峰;
以二次行波峰的终点作为扫描七点,用扫描框逐行进行扫描,当扫描到二次行波谷之后出现扫描框中的行波峰的灰度值的平均值大于这一个行波峰的灰度值的平均值时,则认为一个二次行波谷扫描完成,得到二次行波谷。
7.根据权利要求1所述的无线框表格图像表格结构识别方法,其特征在于,所述方法包括:在步骤对列投影进行扫描获得列波峰和列波谷执行后,再次对列波峰和列波谷分别进行扫描获得二次列波峰和二次列波谷,将二次列波谷作为计算表格线位置得到表格结构的依据。
8.根据权利要求7所述的无线框表格图像表格结构识别方法,其特征在于,所述对列波峰和列波谷分别进行扫描获得二次列波峰和二次列波谷包括以下步骤:
在得到列波谷和列波峰的基础上,对一个列波峰从左至右进行扫描,寻找到列波峰中的极大值点集和极小值点集;
将极大值点及其附近的点与其两侧的极小值及其附近的点的分别求斜率,得到左斜率集和右斜率集;
以一个极大值点为中心求出的两侧斜率最大的部分为一个二次列波峰,一个列波峰中除检测出的二次列波峰外均为二次列波谷。
9.根据权利要求1至8中任一所述的无线框表格图像表格结构识别方法,其特征在于,所述方法还包括步骤:对灰度图像进行直线检测,根据检测到的直线对表格结构进行修正。
10.根据权利要求9所述的无线框表格图像表格结构识别方法,其特征在于,所述方法包括:以一定格式将识别到的表格结构输入到后缀为json的文档中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海致宇信息技术有限公司,未经上海致宇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111672896.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动化细胞制备装置
- 下一篇:一种表格合并单元格检测方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序