[发明专利]银行回单识别方法、系统、设备及存储介质在审
申请号: | 202210331613.8 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114898371A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 吴昆 | 申请(专利权)人: | 迈容智能科技(上海)有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14;G06V30/18;G06V30/413;G06V10/82;G06N3/04;G06N3/08;G06Q40/02 |
代理公司: | 上海诺衣知识产权代理事务所(普通合伙) 31298 | 代理人: | 衣然 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 银行 回单 识别 方法 系统 设备 存储 介质 | ||
本发明公开了一种银行回单识别方法,它包括:获取待识别的银行回单图像;检测出所述银行回单图像的表格区域;采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图;将所述多个被判定为文字区域的子图串联起来,以得到待识别的文字区域;对所述待识别的文字区域进行文字识别,以实现图像数据至文字数据的转化。相应的,本发明还提供一种银行回单识别系统、电子设备以及存储介质。本发明可以有效满足对不同样式银行回单进行信息提取的需求,进而显著提高银行回单的识别效率。
技术领域
本发明涉及深度学习与计算机技术领域,具体涉及一种基于深度学习的银行回单识别方法、系统、电子设备以及存储介质。
背景技术
银行回单是为企业客户提供其网银付款交易查询、下载、打印(补打)以及验证功能的有效凭证。回单的内容主要包括日期、编号、户名、账号、币种、金额、摘要以及开户行等详细信息,对于每一笔账务,均有相应的一张回单。银行回单作为企业编制记账凭证的原始依据,在记账过程中涉及大量回单信息的录入,需要耗费大量的人力、物力和财力。
随着OCR技术的迅速发展,印刷体文字识别技术已经相当成熟,并得到了广泛应用。目前,银行回单OCR技术可识别账户名、收付款账户和金额等信息;已被应用在ERP智能记账、RPA财务机器人、财务影像系统等行业,通过OCR识别技术可快速将银行回单信息自动录入到系统中,大大节省了录入时间。
传统的银行回单OCR技术往往依赖于识别对象的特点,需要根据银行回单格式设计个性化的模板。但国内各大银行的电子回单格式并不相同,甚至是同一家银行也存在格式不统一的问题,这就需要定制大量的银行回单模板,导致识别过程过分依赖人工干预,识别效率较低。
发明内容
针对以上技术问题,本发明提供一种银行回单识别方法,以满足对不同样式银行回单进行信息提取的需求,提高银行回单的识别效率。相应的,本发明还提供一种银行回单识别系统、电子设备以及存储介质。
根据本发明的一方面,提供一种银行回单识别方法,包括如下步骤:
获取待识别的银行回单图像;
检测出所述银行回单图像的表格区域;
采用图像页面分割算法对表格区域的图像进行文字检测,以得到多个被判定为文字区域的子图;
将所述多个被判定为文字区域的子图串联起来,以得到待识别的文字区域;
对所述待识别的文字区域进行文字识别,以实现图像数据至文字数据的转化。
在本发明的一实施方式中,所述检测出所述银行回单图像的表格区域包括:
采用基于U-Net网络的语义分割模型对所述银行回单图像的表格区域进行检测;
采用生成对抗网络对检测出的表格区域的整体形状进行约束。
在本发明的一实施方式中,所述采用基于U-Net网络的语义分割模型对所述银行回单图像的表格区域进行检测包括:
所述银行回单图像被分割为多个联通区域;
所述检测出所述银行回单图像的表格区域还包括:
选取最大联通区域作为候选表格区域;
填充候选表格区域内的联通区域使其作为表格区域的一部分;以及
基于候选表格区域的边界轮廓确定表格区域的四个顶点。
在本发明的一实施方式中,所述基于候选表格区域的边界轮廓确定表格区域的四个顶点包括:
检测出候选区域边界的轮廓;
将所述轮廓的曲线折线化,对图像轮廓点进行多边形拟合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于迈容智能科技(上海)有限公司,未经迈容智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210331613.8/2.html,转载请声明来源钻瓜专利网。