[发明专利]一种自适应的智能单据识别录入装置及其使用方法有效

专利信息
申请号: 201910072775.2 申请日: 2019-01-25
公开(公告)号: CN109840519B 公开(公告)日: 2023-05-05
发明(设计)人: 王营;李承涛;陈小二;盛杨;周鑫 申请(专利权)人: 青岛盈智科技有限公司
主分类号: G06V30/14 分类号: G06V30/14;G06V20/62;G06V30/24
代理公司: 青岛高晓专利事务所(普通合伙) 37104 代理人: 张世功
地址: 266000 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于图像识别处理领域,涉及一种自适应的智能单据识别录入装置及其使用方法,数据采集模块将客户的纸质文本通过扫描或者拍摄,采集成图片文件,预处理模块会利用形态学处理算法,对图像中的文本做分块处理,将每行或者表格中的格子做成不等的小区块,文字识别模块将各个小区块通过二值处理;然后相关性分析模块根据预先配置的关键字及规则,对文本块的关系做分析,并指导数据抽取模块对需要的字段内容做提取,纠偏模块会根据先前的识别及纠偏历史数据,对提取的内容做一些校验和自动纠正,最终保存结果,并返回数据到调用方。其设计构思巧妙,使用安全方便,智能化程度高,同时识别准确度高,应用环境友好,市场前景广阔。
搜索关键词: 一种 自适应 智能 单据 识别 录入 装置 及其 使用方法
【主权项】:
1.一种自适应的智能单据识别录入装置及其使用方法,其特征在于包括有单据采集模块:基于图像识别的单据智能分析与自动存储方法,包括识别装置,所述识别装置包括有硬件扫描或者拍摄设备,用以取获取纸质单据图像;图像预处理模块:用以接收单据采集模块采集的图像,并对图像进行膨胀算法的预处理,便于系统获取结构化的文字,以及文字或者表格的坐标位置,便于后期对文字进行相关性的分析,定位和提取。文字识别模块:对图像预处理模块中通过膨胀算法以及表格标记的各个小文本块进行文字识别,通过对膨胀获取的提取单元进行二值化处理,有效去除有些单据的背景及底图的干扰,提高图像的识别准确率,经过二值化处理的图片会更清晰,特征更明显,有利于文字识别模块进行文字识别;该识别方式能够避免对整片文档的大面积识别,而是针对预处理模块分析出来的多个小区域进行识别,有效提高了识别率,在文字识别模块识别完成后,将处理后的数据传输至相关性分析模块;相关性分析模块:相关性分析模块是本发明的核心模块,能够根据文字识别的结果和配置的相关规则,对文字的相关性进行分析,判断各个文字块之间的关系,如判断收货人是在<收货人>这个关键字的下面还是右面,对于人眼很容易正确匹配并判断的信息,对于计算机并不具备人类的认知能力,所以计算机所读取到的就是一些文字,却无法解读其含义,以及文字之间的关系,本方法则会对文本直接的关系做约定和配置,通过相关性分析,下一步将对文本做结构分析获得的各字段进行信息提取;数据抽取模块:相关性分析明确了文字块之间的相互关系,数据抽取模块根据相关性分析模块中相关性分析的结果,对数据进行抽取工作,以获取结构化的数据,并返回到调用方;抽取的方式为如下,根据预先配置的需要抽取的数据字段,以及对应的关键字信息,进行数据的实际抽取,抽取时以相关性分析为依据;数据抽取模块根据上述的相关性分析,得到字段与文字的对应关系,并组织成第三方系统需要的数据格式JSON、XML等,并将数据返回到第三方系统;数据存储模块:数据抽取后,系统对抽取结果保存到数据库,以备后续纠错时参考;智能纠偏模块:包括有设计核对子模块,用以对识别结果做核对,以提高识别的准确率,通过对数据抽取模块的数据抽取结果,以及数据抽取历史和纠正结果的比对,对抽取的数据做自动的智能纠正;包括有对港口信息的纠正,针对单据中对港口信息描述不规范的情形,该模块自动将识别结果与数据库数据做比对,将错误的港口根据比对结果进行自动纠正;还包括有CBM前面的数字被错误的识别为了重量,该模块将根据数据记忆和知识,自动找到KGS的值对重量和体积进行纠正;人工矫正界面:本发明界面提供识别后的结果与原图片,操作人员能够点击识别结果的内容,智能纠偏模块根据上述获得的识别结果的对应坐标信息,自动框选原图片的区域,便于操作人员进行核对和修改;操作人员通过设计核对界面矫正的结果将被保存到智库,用于自动矫正纠偏,并为机器深度学习提供样本,以便在后期进一步提高准确率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛盈智科技有限公司,未经青岛盈智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910072775.2/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top