[发明专利]用于文本识别的表格模板建立方法、文本识别方法、系统在审
| 申请号: | 202110507187.4 | 申请日: | 2021-05-10 |
| 公开(公告)号: | CN113191131A | 公开(公告)日: | 2021-07-30 |
| 发明(设计)人: | 张钶;杨皓 | 申请(专利权)人: | 重庆中科云从科技有限公司 |
| 主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/18;G06K9/20;G06K9/32;G06F16/903;G06F16/22 |
| 代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 王天骐;宋宝库 |
| 地址: | 401122 重庆市*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 文本 识别 表格 模板 建立 方法 系统 | ||
1.一种用于文本识别的表格模板建立方法,其特征在于,所述建立方法包括:
获取对上传的第一模板图像进行OCR识别后得到的识别结果;
基于所述识别结果,绘制电子表格;
响应于接收到的选取所述电子表格中感兴趣区域的指令,确定感兴趣区域的区域信息;
基于所述区域信息,生成表格模板。
2.根据权利要求1所述的表格模板建立方法,其特征在于,“基于所述识别结果,绘制电子表格”的步骤进一步包括:
基于所述识别结果,在Web页面上绘制电子表格。
3.根据权利要求1所述的表格模板建立方法,其特征在于,所述感兴趣区域包括所述电子表格的单元格区域、整行区域、整列区域和表格外区域中的至少一种。
4.根据权利要求1所述的表格模板建立方法,其特征在于,所述区域信息包括所述感兴趣区域的坐标信息和/或所述感兴趣区域内的字符信息。
5.根据权利要求1所述的表格模板建立方法,其特征在于,所述建立方法还包括:
基于与第一模板图像同类型的第二模板图像,对所述表格模板进行验证;
响应于验证通过的指令,生成所述表格模板。
6.一种用于文本识别的表格模板建立系统,其特征在于,所述建立系统包括:
第一获取模块,其被配置成获取对上传的第一模板图像进行OCR识别后得到的识别结果;
绘制模块,其被配置成基于所述识别结果,绘制电子表格;
区域信息确定模块,其被配置成响应于接收到的选取所述电子表格中感兴趣区域的指令,确定感兴趣区域的区域信息;
模板生成模块,其被配置成基于所述区域信息,生成表格模板。
7.根据权利要求6所述的表格模板建立系统,其特征在于,所述绘制模块进一步被配置成通过如下方式来基于所述识别结果,绘制电子表格:
基于所述识别结果,在Web页面上绘制电子表格。
8.根据权利要求6所述的表格模板建立系统,其特征在于,所述感兴趣区域包括所述电子表格的单元格区域、整行区域、整列区域和表格外区域中的至少一种。
9.根据权利要求6所述的表格模板建立系统,其特征在于,所述区域信息包括所述感兴趣区域的坐标信息和/或所述感兴趣区域内的字符信息。
10.根据权利要求6所述的表格模板建立系统,其特征在于,所述建立系统还包括:
验证模块,其被配置成基于与第一模板图像同类型的第二模板图像,对所述表格模板进行验证;
所述模板生成模块进一步被配置成响应于验证通过的指令,生成所述表格模板。
11.一种文本识别方法,其特征在于,所述文本识别方法包括:
读取表格模板中的感兴趣区域的区域信息;
获取对上传的待处理表格图像进行OCR识别后得到的识别结果数组;
基于所述识别结果数组和所述感兴趣区域的区域信息,匹配所述识别结果数组中所述感兴趣区域的字符信息;
将所述感兴趣区域的字符信息进行组合,以得到结构化文本;
其中,所述表格模板是基于权利要求1至5中任一项所述的建立方法得到的。
12.根据权利要求11所述的文本识别方法,其特征在于,“基于所述识别结果数组和所述感兴趣区域的区域信息,匹配所述识别结果数组中所述感兴趣区域的字符信息”的步骤进一步包括:
遍历每个所述感兴趣区域,利用每个所述感兴趣区域的区域信息匹配所述识别结果数组中的字符信息;
将匹配到的每个感兴趣区域的字符信息输出到一个临时单元格数组;
“将所述感兴趣区域的字符信息进行组合,以得到结构化文本”的步骤进一步包括:
将多个所述临时单元格数组进行组合,以得到所述结构化文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆中科云从科技有限公司,未经重庆中科云从科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110507187.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于双流网络结构的快速显著性目标检测方法
- 下一篇:一种冷却结构的火焰筒





