[发明专利]文档处理方法及装置、用于图像的数据提取方法及装置在审
申请号: | 202111156200.2 | 申请日: | 2021-09-29 |
公开(公告)号: | CN113886582A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 黄海平 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/34 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 鄢功军 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 处理 方法 装置 用于 图像 数据 提取 | ||
本公开提供了一种文档处理方法,涉及计算机技术领域,尤其涉及文档处理技术领域。具体实现方案为:根据文档页面中行文字图像的位置信息,生成多个第一包围框;根据多个第一包围框的位置信息,生成多个第二包围框,每个第二包围框用于标记文档页面中一个文本稀疏区域;对相邻的第二包围框执行合并操作,得到多个候选包围框;针对多个候选包围框,根据每个候选包围框的位置信息,确定文档页面的多个局部图像;以及根据多个局部图像中的内容,生成目标图像。本公开还提供了一种文档处理装置、用于图像的数据提取方法及装置、电子设备和存储介质。
技术领域
本公开涉及计算机技术领域,尤其涉及文档处理技术领域。更具体地,本公开提供了一种文档处理方法及装置、用于图像的数据提取方法及装置、电子设备和存储介质。
背景技术
文档中可以包含一个或多个图表。这些图表的数据可以是非结构化的数据,例如图片、背景图等。相关技术中,可以人工截取文档中的图表,然后观察图表中的特征点(例如,坐标轴原点、刻度线端点等)和数据值,以从这些图表中提取出结构化数据。
发明内容
本公开提供了一种文档处理方法及装置、用于图像的数据提取方法及装置、电子设备和存储介质。
根据第一方面,提供了一种文档处理方法,该方法包括:根据文档页面中行文字图像的位置信息,生成多个第一包围框;根据上述多个第一包围框的位置信息,生成多个第二包围框,每个第二包围框用于标记上述文档页面中一个文本稀疏区域;对相邻的第二包围框执行合并操作,得到多个候选包围框;针对上述多个候选包围框,根据每个候选包围框的位置信息,确定文档页面的多个局部图像;以及根据上述多个局部图像中的内容,生成目标图像。
根据第二方面,提供了一种用于图像的数据提取方法,该方法包括:根据目标图像内每个像素的像素值,确定上述目标图像中位于坐标轴上的N个标记点的坐标;根据N个标记点的坐标,对上述目标图像执行划分操作,得到N+1个子区域;针对N+1个子区域中第i个子区域,执行文本识别操作,得到与第i个子区域对应的第i组数据;i=1,......,N+1;其中,上述目标图像是根据本公开提供的文档处理方法生成的。
根据第三方面,提供了一种文档处理装置,该装置包括:第一生成模块,用于根据文档页面中行文字图像的位置信息,生成多个第一包围框;第二生成模块,用于根据上述多个第一包围框的位置信息,生成多个第二包围框,每个第二包围框用于标记上述文档页面中一个文本稀疏区域;合并模块,用于对相邻的第二包围框执行合并操作,得到多个候选包围框;第一确定模块,用于针对上述多个候选包围框,根据每个候选包围框的位置信息,确定文档页面的多个局部图像;以及第三生成模块,用于根据上述多个局部图像中的内容,生成目标图像。
根据第四方面,提供了一种用于图像的数据提取装置,该装置包括:第二确定模块,用于根据目标图像内每个像素的像素值,确定上述目标图像中位于坐标轴上的N个标记点的坐标;划分模块,用于根据N个标记点的坐标,对上述目标图像执行划分操作,得到N+1个子区域;文本识别模块,用于针对上述N+1个子区域中第i个子区域,执行文本识别操作,得到与第i个子区域对应的第i组数据;i=1,......,N+1;其中,上述目标图像是根据本公开提供的文档处理装置生成的。
根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
根据第七方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现根据本公开提供的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111156200.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轮椅式移动双臂协作机器人
- 下一篇:一种光伏电站监控系统硬件拓扑结构