[发明专利]一种基于OCR的废钢再回收磅单自动识别系统在审
| 申请号: | 202211678837.2 | 申请日: | 2022-12-26 |
| 公开(公告)号: | CN115862028A | 公开(公告)日: | 2023-03-28 |
| 发明(设计)人: | 刘铁;张海龙;王大鹏;何福威 | 申请(专利权)人: | 华录科技文化(大连)有限公司 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19 |
| 代理公司: | 大连至诚专利代理事务所(特殊普通合伙) 21242 | 代理人: | 王丹;陈义华 |
| 地址: | 116000 辽宁省大连*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ocr 废钢 回收 自动识别 系统 | ||
本发明公开了一种基于OCR的废钢再回收磅单自动识别系统,包括客户磅单配置模块用于根据客户上传的磅单图片定义磅单的磅单规则;OCR训练模块用于获取客户上传的磅单图片中的字符进行矫正并存储;OSS对象存储模块用于存储客户上传的磅单图片;磅单OCR图文识别模块用于获取磅单图片并进行处理,基于OCR图片识别引擎识别磅单图片中的文本信息,根据客户磅单配置模块的磅单规则将文本信息转化为结构化的磅单数据;关系型数据库存储模块用于存储经磅单OCR图文识别模块获取的磅单数据;人工校验模块用于将磅单图片、磅单数据提供给人工进行复核。自动根据磅单图片识别出磅单结构化数据信息,再次由人工进行校验复核,提高了磅单识别效率和准确性。
技术领域
本发明涉及再生资源回收领域,尤其涉及一种基于OCR的废钢再回收磅单自动识别系统。
背景技术
在废钢回收行业中,由于下游客户众多,各个客户的信息化水平不一,有的客户信息化水平较高,能够比较标准的机打磅单,有的客户信息化水平较低,只能提供手写磅单,同时每个客户的磅单单据格式、质量、清晰度是不同的,因此就造成了单据样式多样化,单据质量多样化,单据信息多样化等问题。将纸质磅单上的涉及磅单号、客户、供货单位、过磅日期、货物名称、货物规格、车牌号、毛重、皮重、扣杂、净重、实重、备注等信息并转化为能够存储在信息化系统重的结构化数据,就成为企业信息化的必然。目前,很多回收公司均采用人工手工将纸质磅单信息录入电脑重的方式来解决盖类问题,其解决过程需要耗费大量的人力,人工成本较高;同时其工作过程单调、重复度高,极容易产生人工失误。
发明内容
本发明提供一种基于OCR的废钢再回收磅单自动识别系统,以克服上述技术问题。
一种基于OCR的废钢再回收磅单自动识别系统,包括客户磅单配置模块、OCR训练模块、OSS对象存储模块、磅单OCR图文识别模块、关系型数据库存储模块以及人工校验模块,
客户磅单配置模块用于根据客户上传的磅单图片定义磅单的磅单规则,所述定义磅单的磅单规则包括确定磅单所包含的字段及各字段的约束条件,所述约束条件为限制字段可包含字符的字符长度、字符种类;
OCR训练模块用于获取客户上传的磅单图片集合,分别将磅单图片进行格式转化并生成合成文件,并对合成文件中的字符进行矫正,将矫正后的字符集合作为客户的字体库,所述OCR训练模块包括上传样本模块、样本合成模块、字符矫正模块、样本字体库模块,所述上传样本模块用于获取客户上传的磅单图片集合,所述样本合成模块用于分别将磅单图片集合中的磅单图片转化为tif格式的文件,并将所有tif格式的文件进行合成,所述字符矫正模块用于根据符合字符标准的字符集合对合成文件中的字符进行矫正,所述样本字体库模块用于获取并保存字符矫正模块矫正后的字符集合;
OSS对象存储模块用于存储客户上传的磅单图片;
磅单OCR图文识别模块用于获取OSS对象存储模块存储的磅单图片,对磅单图片进行处理,获取处理后的磅单图片,基于OCR图片识别引擎和样本字体库模块的字符集识别磅单图片中的文本信息,根据客户磅单配置模块的磅单规则将文本信息转化为结构化的磅单数据,所述磅单OCR图文识别模块包括磅单图片处理模块、磅单图片文字识别模块、磅单文字转换模块,所述磅单图片处理模块用于获取OSS对象存储模块存储的磅单图片并对磅单图片进行处理,所述处理包括裁剪磅单图片、去除磅单图片杂色、对磅单图片像素进行聚类处理、转换磅单图片颜色处理,所述磅单图片文字识别模块用于获取处理后的磅单图片,基于OCR图片识别引擎识别磅单图片中的文本信息,所述磅单文字转换模块用于根据客户磅单配置模块的磅单规则将文本信息转化为结构化的磅单数据;
关系型数据库存储模块用于存储经磅单OCR图文识别模块获取的磅单数据;
人工校验模块用于将磅单图片、磅单数据提供给人工进行复核。
优选地,所述去除磅单图片杂色包括,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华录科技文化(大连)有限公司,未经华录科技文化(大连)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211678837.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:头戴设备
- 下一篇:适配目标保证率的生态流量动态计算方法及系统





