[发明专利]一种自适应的智能单据识别录入装置及其使用方法有效
申请号: | 201910072775.2 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109840519B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 王营;李承涛;陈小二;盛杨;周鑫 | 申请(专利权)人: | 青岛盈智科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V20/62;G06V30/24 |
代理公司: | 青岛高晓专利事务所(普通合伙) 37104 | 代理人: | 张世功 |
地址: | 266000 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 智能 单据 识别 录入 装置 及其 使用方法 | ||
发明属于图像识别处理领域,涉及一种自适应的智能单据识别录入装置及其使用方法,数据采集模块将客户的纸质文本通过扫描或者拍摄,采集成图片文件,预处理模块会利用形态学处理算法,对图像中的文本做分块处理,将每行或者表格中的格子做成不等的小区块,文字识别模块将各个小区块通过二值处理;然后相关性分析模块根据预先配置的关键字及规则,对文本块的关系做分析,并指导数据抽取模块对需要的字段内容做提取,纠偏模块会根据先前的识别及纠偏历史数据,对提取的内容做一些校验和自动纠正,最终保存结果,并返回数据到调用方。其设计构思巧妙,使用安全方便,智能化程度高,同时识别准确度高,应用环境友好,市场前景广阔。
技术领域:
发明属于图像识别处理领域,涉及一种物流单据的识别装置,特别是一种自适应的智能单据识别录入装置及其使用方法。
背景技术:
在空运,海运等进出口业务中,业务过程中流转的单据格式及类型(如:客户委托单,船公司订舱回执单等)多样,有可以直接拷贝内容的word,excel,textual PDF等格式,也有相当一部分是图片格式的文件,或者干脆是纸质文件。由于历史的原因,来自全球各地的空运及海运单据的类型非常多,行业内对客户单据没有统一格式标准,甚至单个客户也会提供多种格式的单据。这种情况下,对一些体量大的物流或者是货物代理公司,在面对几百上千个客户的时候,每天产生的单据流转量非常巨大,类型格式也相当多,据统计,一个几十人的中等规模的货代公司每个月流转的单据就几千甚至上万份。如果要把单据里面的内容再逐个录入到自己的ERP或者是其它业务系统,工作程序繁琐,工作量大,需要大量的手工人力工作,同时也容易在操作录入过程中出现差错。
为了解决上述类似的问题,申请号为CN201710800489.4的中国专利公开了一种基于图像识别的物流单据智能分析与自动存储方法,该方法公开了一种基于图像识别的物流单据智能分析与自动存储方法,包括识别装置,所述识别装置包括:扫描拍摄模块,图形分割模块,图片处理模块,智能识别模块,等多个模块,该方法能够自动识别图片中的文字信息,对文字信息做进一步的对比和判断,并且将信息结果保存起来,并可通过人工修改后经过自我学习丰富自己的文字库从而提高以后识别的效率和准确性,该种图片文字识别方法主要针对手写体做识别优化,识别范围只能对固定格式的国内快递运单做内容识别,对文字的布局,位置版面有格式要求。要求面单尺寸较小,内容不多,无法实现大篇幅的无固定格式的文字识别及提取功能。
申请号为CN201810087635.8的中国专利公开了一种识别纠偏系统及方法,对纸质单据信息进行数据化处理,包括:图像获取单元,用于获取纸质单据图像;识别单元,用于识别所述单据图像中的文字,得到单据的识别结果数据集;信息纠偏单元,用于对所述识别结果数据集进行纠偏,得到纠偏后的单据信息;数据存储单元,用于存储信息数据库、所述单据图像、所述单据的识别结果数据集及所述纠偏后的单据信息。其中,所述信息数据库为所述信息纠偏单元的训练数据。发明涉及的是一种识别纠偏系统和方法,改善了OCR技术识别文字序列精度、准确率较低的弊端。该方法对手写单据的识别率较低的问题提供了一种识别纠偏系统和方法,改善了OCR技术识别文字序列精度准确率较低的弊端。
但是上述专利中OCR技术对识别对象有格式要求,需要通过模板的方式,对需要提取的内容图片用人工的方式做对应的模板,识别系统就根据模板标注的固定位置坐标识别相应区域的文本,以达到文字提取的目的。但这中做法仍存在如下缺陷:
一是需要人工做模板,增加工作量,尤其是要支持大量单据的情况下,需要定制很多模板,在业务员的实际操作层面非常麻烦,操作员面对大量模板的选择工作将变得非常繁琐。
二是对固定格式的文本做框选有时候不够精准,在填写的信息存在错位并且没有与固定格式完全对应时,做模板的时候就很难定位框选的尺寸大小,特别是错位的内容较多时,那么有些内容在识别中很有可能会被漏掉;
三是对于尺寸较小的单据如果格式非常固定,可能可以做到准确度比较高,但对于A4甚至更大版面的单据,包含更多内容的委托书就更难通过固定模板来达到目的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛盈智科技有限公司,未经青岛盈智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910072775.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种结合分类与域适应的视觉追踪方法
- 下一篇:一种发票关键信息识别方法及系统