[发明专利]一种基于OCR的多票据自动识别方法及识别系统在审

专利信息
申请号: 201911192294.1 申请日: 2019-11-28
公开(公告)号: CN111008635A 公开(公告)日: 2020-04-14
发明(设计)人: 章珏 申请(专利权)人: 的卢技术有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06K9/22
代理公司: 南京禹为知识产权代理事务所(特殊普通合伙) 32272 代理人: 王晓东
地址: 211103 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 ocr 票据 自动识别 方法 识别 系统
【说明书】:

发明公开了一种基于OCR的多票据自动识别方法及识别系统,包括以下步骤,获取OCR的票据样本;图像采集模块采集待识别的票据图像;所述票据图像输入图像预处理模块中处理得到次级图像;去嘈杂模块将所述次级图像去嘈杂后获得标准图像;所述标准图像输入票据识别模块内进行检测完成识别。本发明的有益效果:提出的基于OCR的多票据自动识别方法,能够减小识别一张图像中带有多张不同票据的存在的识别差异。

技术领域

本发明涉及文字识别的技术领域,尤其涉及一种基于OCR的多票据自动识别方法及一种基于OCR的多票据自动识别系统。

背景技术

近年来票据识别服务发展迅猛,但票据识别率仍相对较低,使得票据识别后还需票据录入人员针对每个识别出的字段进行全面的人工核验以纠正自动识别的错误信息。识别率较低、人工核验过程相对比较耗时,使得票据识别服务的商业化利用率一直较低。

基于AI的智能财务报销系统中,可以借助OCR等技术进行发票的自动识别,以减少报销人员录入工作量、报销审核人员的审核工作量等,提升报销自动化程度和报销效率。长久以来,票据识别引擎没有形成统一的规范,各识别引擎对外提供的服务API区别较大,无法相互兼容。尽管电子支付、电子票据等发展日益增多,传统纸质票据仍然是现实工作和生活中广泛使用的方式之一,如各类纸质发票、金融票据等。目前现有的票据识别针对不同类型的识别样本,其文字的检测和识别效果差异很大。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有存在的问题,提出了本发明。

因此,本发明解决的一个技术问题是:提出一种不同类型票据的识别方法,能够在识别不同的样本时保持较小的识别差异。

为解决上述技术问题,本发明提供如下技术方案:一种基于OCR的多票据自动识别方法,包括以下步骤,获取OCR的票据样本;图像采集模块采集待识别的票据图像;所述票据图像输入图像预处理模块中处理得到次级图像;去嘈杂模块将所述次级图像去嘈杂后获得标准图像;所述标准图像输入票据识别模块内进行检测完成识别。

作为本发明所述的基于OCR的多票据自动识别方法的一种优选方案,其中:所述图像预处理模块包括以下预处理步骤,将所述票据图像旋转或透视缩放;旋转或透视缩放后将所述票据图像中的文字沿水平垂直方向对齐;经对齐的图像进行剪裁得到所述次级图像。

作为本发明所述的基于OCR的多票据自动识别方法的一种优选方案,其中:所述去嘈杂模块包括以下步骤,对所述次级图像进行去色处理;调整所述次级图像的直方图信息;保留浅色区域中的浅色像素和深色区域中的深色像素;获得高反差样本的所述标准图像。

作为本发明所述的基于OCR的多票据自动识别方法的一种优选方案,其中:所述票据识别模块包括以下识别处理步骤,包含待识别字符的所述标准图像进行分析结构;运用阈值对待测对象进行去噪和矫正;对文本信息做行列分割;将分割后的字符图像导入识别模型中进行处理得到原图中的字符信息。

作为本发明所述的基于OCR的多票据自动识别方法的一种优选方案,其中:所述识别模型采用CTPN算法模型,包括以下识别步骤,对复杂场景内横排的文字分割成的不同单元块检测;加入竖直Anchor检测竖直文字;利用双向LSTM层学习图像中的空间特征及序列特征;使用正则表达来查找票据图像中的每个字符对应含义。

作为本发明所述的基于OCR的多票据自动识别方法的一种优选方案,其中:所述文字分割包括以下步骤,通过图像非均匀分割方法对单个文字进行切割;利用函数得出每个字符的宽度,在多个近似分类中选出切分合适的一组;使用CNN算法模型对分类后这组字符进行识别辨认。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于的卢技术有限公司,未经的卢技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911192294.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top