[发明专利]OCR模型训练方法、系统及装置有效

专利信息
申请号: 202011307368.4 申请日: 2020-11-19
公开(公告)号: CN112418304B 公开(公告)日: 2021-10-29
发明(设计)人: 司法 申请(专利权)人: 北京云从科技有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06K9/34
代理公司: 北京瀚仁知识产权代理事务所(普通合伙) 11482 代理人: 宋宝库;王天骐
地址: 102300 北京市门头沟区石*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: ocr 模型 训练 方法 系统 装置
【说明书】:

发明属于图像处理技术领域,具体提供一种OCR模型训练方法、系统及装置。本发明旨在解决目前较少数量的图像样本无法使OCR模型的准确度达到较高水平的问题。为此目的,本发明通过首先对初始图像样本进行标注并生成第一OCR训练集,再在训练模型中输入第一OCR训练集进行训练,得到第一OCR模型,将实物图像样本输入第一OCR模型进行识别,根据识别结果获得实物图像样本中被识别错误的图像样本,将被识别的错误的图像样本汇总为第一补充OCR训练集,并分配第一OCR训练集与第一补充OCR训练集的权重,合并后生成第一优化OCR训练集,在第一OCR模型中输入第一优化OCR训练集进行训练,以得到准确度更高的第一优化OCR模型进行字符识别。

技术领域

本发明涉及计算机视觉当中的图像处理技术领域,尤其涉及一种OCR模型训练方法、系统及装置。

背景技术

OCR(Optical Character Recognition,光学字符识别)作为计算机视觉中一个重要的应用领域,由于其有监督网络的特性,需要大量的训练数据支撑才能取得良好的效果。因此,在OCR领域中,包含各种场景的庞大数据训练集对于得到一个良好的OCR模型至关重要。

但是现有技术中的OCR模型,其训练集通常是预设好的,在进行调试完毕后就开始进入实际应用,伴随着实际使用,往往真实的识别准确度会低于训练出后的预期准确度,降低用户体验。举例而言,在银行体系中,某些票据给开发模型的仅有有限数量的图像样本,此时制作出的训练集的数量较少,因此训练出的OCR模型的识别准确度相应地就不是很高。

发明内容

为了克服上述缺陷,提出了本发明,以解决或至少部分地解决目前较少数量的图像样本无法使OCR模型的准确度达到较高水平的技术问题。本发明提供了一种OCR模型训练方法、系统及装置。

第一方面、提供一种OCR模型训练方法,包括:

对初始图像样本进行标注以生成第一OCR训练集;

在待训练的OCR模型中输入所述第一OCR训练集进行训练,得到第一OCR模型;

将实物图像样本输入所述第一OCR模型进行识别;

根据识别结果获得所述实物图像样本中被识别错误的图像样本;

将被识别错误的图像样本作为第一补充OCR训练集,并为第一OCR训练集与第一补充OCR训练集分别分配权重,合并后生成第一优化OCR训练集;

在所述第一OCR模型中输入所述第一优化OCR训练集进行训练,以得到第一优化OCR模型。

在上述方法的优选技术方案中,所述方法还包括:

循环执行如下操作,直至第n优化OCR模型满足需求:

继续将实物图像样本输入第n-1优化OCR模型进行识别;

根据识别结果获得所述实物图像样本中被识别错误的图像样本;

将被识别错误的图像样本作为第n补充OCR训练集,并为所述第n-1优化OCR训练集与所述第n补充OCR训练集分别分配权重,合并后生成第n优化OCR训练集;

在第n-1优化OCR模型中输入所述第n优化OCR训练集进行训练,以得到第n优化OCR模型;

其中,n为大于等于2的自然数。

在上述方法的优选技术方案中,“继续将实物图像样本输入第n-1优化OCR模型进行识别”的步骤之前,所述方法还包括:

去除已分配的第n-1优化OCR训练集中第n-1OCR训练集和第n-1补充OCR训练集的权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云从科技有限公司,未经北京云从科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011307368.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top