[发明专利]一种基于OCR的图像处理方法、系统、设备及介质在审
| 申请号: | 202010315758.X | 申请日: | 2020-04-21 |
| 公开(公告)号: | CN111539424A | 公开(公告)日: | 2020-08-14 |
| 发明(设计)人: | 周曦;姚志强;陈琳;程乐松;许梅芳 | 申请(专利权)人: | 北京云从科技有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04 |
| 代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 代玲 |
| 地址: | 102300 北京市门头沟区石*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ocr 图像 处理 方法 系统 设备 介质 | ||
本发明提供一种基于OCR的图像处理方法、系统、设备及介质,包括:通过识别图像中的一个或多个字符,找出与所述一个或多个字符最相近或最相似的一个或多个字体,生成一个或多个训练样本集数据;根据所述一个或多个训练样本集数据进行一次或多次训练,生成一个或多个目标识别模型。本发明针对OCR识别算法目前存在的问题,提供目标识别模型,可以根据目标对象自动选择字体,自动合成N种仿真训练数据,自动选择最优的组合训练识别模型并迭代优化,解决了普通OCR识别模型泛化性差、开发周期长、准确率低的问题,实现快速开发精准识别模型的目的,且本发明所提供的目标识别模型具有很好的鲁棒性,在真实场景中具有高准确率。
技术领域
本发明涉及图像识别技术,特别是涉及一种基于OCR的图像处理方法、系统、设备及介质。
背景技术
在OCR(Optical Character Recognition,光学字符识别)领域,通用识别模型的识别率较差,目标识别模型训练成本高。通用OCR识别模型一般需要支持多场景、任意模式、中英文、字母、数字、标点符号的识别。当文本图像的背景较复杂,例如纹理、光照、畸变等,通用OCR是被模型往往识别率不高,不适合用于对识别率要求较高的领域。
而用于识别银行卡、驾驶证、发票等的识别模型,往往要求很高的识别精度,都需要训练专用的识别模型。而每训练一种识别模型都要经历采集样本数据、人工标注数据、训练模型和调参测试等多个阶段,需要较长的开发时间(至少需要1个月的开发时间);且机器学习开发成本高昂导致应用难以落地。因此,在OCR领域,需要一种新的OCR识别模型。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于OCR的图像处理方法、系统、设备及介质,用于解决现有技术中存在的问题。
为实现上述目的及其他相关目的,本发明提供一种基于OCR的图像处理方法,所述方法步骤如下:
识别图像中的一个或多个字符,找出与所述一个或多个字符最相近或最相似的一个或多个字体,生成一个或多个训练样本集数据;
根据所述一个或多个训练样本集数据进行一次或多次训练,生成一个或多个目标识别模型。
可选地,所述目标识别模型包括用于识别以下至少之一:银行卡、驾驶证、发票。
可选地,将带有一个或多个字符标注的文本行图像输入至文本行识别模型中,获取识别结果;
根据所述识别结果和所述字符标注找出正确的一个或多个字符;
将每个正确的字符图像输入至字体识别模型中,获取与所述一个或多个字符最相近或最相似的一个或多个字体。
可选地,所述识别结果包括以下至少之一:文本行图像中的一个或多个字符、文本行图像中每个字符对应的位置。
可选地,获取每个正确字符对应的位置,并基于每个正确字符对应的位置,抠出每个正确的字符图像;
将抠出的每个正确的字符图像输入至字体识别模型中,获取与所述一个或多个字符最相近或最相似的一个或多个字体。
可选地,所述训练样本集数据的数据格式包括以下至少之一:路径、标签、文本行的坐标框、一个或多个单字的坐标框。
可选地,还包括通过增强学习算法从超参空间中搜索一组或多组超参数形成的增强组合,并结合比例因子生成不同类型的一个或多个训练样本。
可选地,还包括通过图像风格转换和/或生成对抗网络生成一个或多个训练样本,并结合增强组合生成的训练样本生成一个或多个训练样本集数据。
可选地,还包括对生成的一个或多个训练样本集数据加入扰动因素进行增强,加入扰动因素的参数包括以下至少之一:字符规则、字符长度、字典范围、字符个数、文本行、文本框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云从科技有限公司,未经北京云从科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010315758.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





