[发明专利]一种基于OCR的废钢再回收磅单自动识别系统在审
| 申请号: | 202211678837.2 | 申请日: | 2022-12-26 |
| 公开(公告)号: | CN115862028A | 公开(公告)日: | 2023-03-28 |
| 发明(设计)人: | 刘铁;张海龙;王大鹏;何福威 | 申请(专利权)人: | 华录科技文化(大连)有限公司 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19 |
| 代理公司: | 大连至诚专利代理事务所(特殊普通合伙) 21242 | 代理人: | 王丹;陈义华 |
| 地址: | 116000 辽宁省大连*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ocr 废钢 回收 自动识别 系统 | ||
1.一种基于OCR的废钢再回收磅单自动识别系统,其特征在于,包括客户磅单配置模块、OCR训练模块、OSS对象存储模块、磅单OCR图文识别模块、关系型数据库存储模块以及人工校验模块,
客户磅单配置模块用于根据客户上传的磅单图片定义磅单的磅单规则,所述定义磅单的磅单规则包括确定磅单所包含的字段及各字段的约束条件,所述约束条件为限制字段可包含字符的字符长度、字符种类;
OCR训练模块用于获取客户上传的磅单图片集合,分别将磅单图片进行格式转化并生成合成文件,并对合成文件中的字符进行矫正,将矫正后的字符集合作为客户的字体库,所述OCR训练模块包括上传样本模块、样本合成模块、字符矫正模块、样本字体库模块,所述上传样本模块用于获取客户上传的磅单图片集合,所述样本合成模块用于分别将磅单图片集合中的磅单图片转化为tif格式的文件,并将所有tif格式的文件进行合成,所述字符矫正模块用于根据符合字符标准的字符集合对合成文件中的字符进行矫正,所述样本字体库模块用于获取并保存字符矫正模块矫正后的字符集合;
OSS对象存储模块用于存储客户上传的磅单图片;
磅单OCR图文识别模块用于获取OSS对象存储模块存储的磅单图片,对磅单图片进行处理,获取处理后的磅单图片,基于OCR图片识别引擎和样本字体库模块的字符集识别磅单图片中的文本信息,根据客户磅单配置模块的磅单规则将文本信息转化为结构化的磅单数据,所述磅单OCR图文识别模块包括磅单图片处理模块、磅单图片文字识别模块、磅单文字转换模块,所述磅单图片处理模块用于获取OSS对象存储模块存储的磅单图片并对磅单图片进行处理,所述处理包括裁剪磅单图片、去除磅单图片杂色、对磅单图片像素进行聚类处理、转换磅单图片颜色处理,所述磅单图片文字识别模块用于获取处理后的磅单图片,基于OCR图片识别引擎识别磅单图片中的文本信息,所述磅单文字转换模块用于根据客户磅单配置模块的磅单规则将文本信息转化为结构化的磅单数据;
关系型数据库存储模块用于存储经磅单OCR图文识别模块获取的磅单数据;
人工校验模块用于将磅单图片、磅单数据提供给人工进行复核。
2.根据权利要求1所述的一种基于OCR的废钢再回收磅单自动识别系统,其特征在于,所述去除磅单图片杂色包括,
步骤1a、对于磅单图片中的每一个像素点,依次获取与其相邻的像素点的像素值,计算当前像素点的像素值与其相邻的像素点的像素值之和,
步骤1b、根据像素值之和相邻像素点的个数计算像素平均值,
步骤1c、将像素平均值作为像素点的像素值。
3.根据权利要求1所述的一种基于OCR的废钢再回收磅单自动识别系统,其特征在于,所述转换磅单图片颜色包括根据公式(1)将彩色磅单图片转换为黑白图片,
gray=(max-mid)*ratio_max+(mid-min)*ratio_max_mid+min(1)
其中,gray为像素灰度值,max、mid和min分别为彩色磅单图片R、G、B分量颜色的像素最大值、中间值和最小值,ratio_max为像素最大值所代表的分量颜色比率,ratio_max_mid为像素最大值、中间值两种分量颜色所形成的复色比率。
4.根据权利要求1所述的一种基于OCR的废钢再回收磅单自动识别系统,其特征在于,所述基于OCR图片识别引擎和样本字体库模块的字符集识别磅单图片中的文本信息包括通过卷积循环神经网络识别磅单图片中的文本信息,将文本信息与样本字体库模块的字符集合进行字符比对,获取比对后的文本信息,所述卷积循环神经网络包括卷积神经网络、循环神经网络、连接性时序分类三个模块。
5.根据权利要求1所述的一种基于OCR的废钢再回收磅单自动识别系统,其特征在于,所述对磅单图片像素进行聚类处理包括,
步骤2a、在磅单图片中随机选择k个像素点,使得所述k个像素点在图像上分布均匀,
步骤2b、确定每个像素点的相邻区域,计算当前像素点的相邻区域内所有像素点的梯度值,将相邻区域内梯度值最小的像素点的像素值替代当前像素点的像素值,
步骤2c、确定每个像素点的聚类区域,基于SLIC算法对图像进行聚类处理,获取每个聚类区域的聚类中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华录科技文化(大连)有限公司,未经华录科技文化(大连)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211678837.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:头戴设备
- 下一篇:适配目标保证率的生态流量动态计算方法及系统





