[发明专利]OCR模型训练方法、系统及装置有效
| 申请号: | 202011307368.4 | 申请日: | 2020-11-19 |
| 公开(公告)号: | CN112418304B | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | 司法 | 申请(专利权)人: | 北京云从科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34 |
| 代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 宋宝库;王天骐 |
| 地址: | 102300 北京市门头沟区石*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | ocr 模型 训练 方法 系统 装置 | ||
本发明属于图像处理技术领域,具体提供一种OCR模型训练方法、系统及装置。本发明旨在解决目前较少数量的图像样本无法使OCR模型的准确度达到较高水平的问题。为此目的,本发明通过首先对初始图像样本进行标注并生成第一OCR训练集,再在训练模型中输入第一OCR训练集进行训练,得到第一OCR模型,将实物图像样本输入第一OCR模型进行识别,根据识别结果获得实物图像样本中被识别错误的图像样本,将被识别的错误的图像样本汇总为第一补充OCR训练集,并分配第一OCR训练集与第一补充OCR训练集的权重,合并后生成第一优化OCR训练集,在第一OCR模型中输入第一优化OCR训练集进行训练,以得到准确度更高的第一优化OCR模型进行字符识别。
技术领域
本发明涉及计算机视觉当中的图像处理技术领域,尤其涉及一种OCR模型训练方法、系统及装置。
背景技术
OCR(Optical Character Recognition,光学字符识别)作为计算机视觉中一个重要的应用领域,由于其有监督网络的特性,需要大量的训练数据支撑才能取得良好的效果。因此,在OCR领域中,包含各种场景的庞大数据训练集对于得到一个良好的OCR模型至关重要。
但是现有技术中的OCR模型,其训练集通常是预设好的,在进行调试完毕后就开始进入实际应用,伴随着实际使用,往往真实的识别准确度会低于训练出后的预期准确度,降低用户体验。举例而言,在银行体系中,某些票据给开发模型的仅有有限数量的图像样本,此时制作出的训练集的数量较少,因此训练出的OCR模型的识别准确度相应地就不是很高。
发明内容
为了克服上述缺陷,提出了本发明,以解决或至少部分地解决目前较少数量的图像样本无法使OCR模型的准确度达到较高水平的技术问题。本发明提供了一种OCR模型训练方法、系统及装置。
第一方面、提供一种OCR模型训练方法,包括:
对初始图像样本进行标注以生成第一OCR训练集;
在待训练的OCR模型中输入所述第一OCR训练集进行训练,得到第一OCR模型;
将实物图像样本输入所述第一OCR模型进行识别;
根据识别结果获得所述实物图像样本中被识别错误的图像样本;
将被识别错误的图像样本作为第一补充OCR训练集,并为第一OCR训练集与第一补充OCR训练集分别分配权重,合并后生成第一优化OCR训练集;
在所述第一OCR模型中输入所述第一优化OCR训练集进行训练,以得到第一优化OCR模型。
在上述方法的优选技术方案中,所述方法还包括:
循环执行如下操作,直至第n优化OCR模型满足需求:
继续将实物图像样本输入第n-1优化OCR模型进行识别;
根据识别结果获得所述实物图像样本中被识别错误的图像样本;
将被识别错误的图像样本作为第n补充OCR训练集,并为所述第n-1优化OCR训练集与所述第n补充OCR训练集分别分配权重,合并后生成第n优化OCR训练集;
在第n-1优化OCR模型中输入所述第n优化OCR训练集进行训练,以得到第n优化OCR模型;
其中,n为大于等于2的自然数。
在上述方法的优选技术方案中,“继续将实物图像样本输入第n-1优化OCR模型进行识别”的步骤之前,所述方法还包括:
去除已分配的第n-1优化OCR训练集中第n-1OCR训练集和第n-1补充OCR训练集的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云从科技有限公司,未经北京云从科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011307368.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水泥加工用混合设备
- 下一篇:一种十字组合线光源





