[发明专利]字符识别与识别模型训练方法、装置和系统及存储介质在审
| 申请号: | 201711447862.9 | 申请日: | 2017-12-27 |
| 公开(公告)号: | CN108875722A | 公开(公告)日: | 2018-11-23 |
| 发明(设计)人: | 贺欣;周昕宇;郭嘉丞 | 申请(专利权)人: | 北京旷视科技有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06N3/04 |
| 代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
| 地址: | 100190 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 样本图像 字符识别 字符区域 模型训练 预测 标注 存储介质 输入字符识别 图像信息输入 累积误差 区域定位 网络 | ||
本发明实施例提供一种字符识别模型训练方法、装置和系统以及字符识别方法、装置和系统以及存储介质。字符识别模型训练方法包括:获取至少一个样本图像和至少一个样本图像各自对应的标注数据,每个样本图像所对应的标注数据用于指示该样本图像的实际字符区域的位置以及实际字符区域中的实际字符;对于至少一个样本图像中的每个样本图像,将该样本图像输入字符识别模型中的区域定位网络,以确定该样本图像的预测字符区域的位置;将预测字符区域的位置对应的图像信息输入字符识别模型中的字符识别网络,以识别预测字符区域中的预测字符;以及至少利用至少一个样本图像各自对应的标注数据和预测字符对字符识别模型进行训练。可有效避免字符识别的累积误差。
技术领域
本发明涉及图像识别领域,更具体地涉及一种字符识别模型训练方法、装置和系统以及一种字符识别方法、装置和系统以及存储介质。
背景技术
在许多领域,均需要进行字符识别。下面以银行卡卡号识别为例进行说明。在金融、财务、保险和电商等行业的业务中,经常会需要录入用户的银行卡卡号信息。随着智能设备的普及和人工智能技术的快速发展,目前许多场景下的银行卡卡号录入工作都从以往的人工输入变成了算法自动识别,这些自动识别算法极大地压缩了银行卡卡号录入所耗费的时间,同时也减小了人工输入错误的可能性。
现有的银行卡卡号识别方法通常分为两个步骤,即卡号区域检测和卡号识别,甚至有些方法还需要在第二步更加细分成卡号区域的字符分割和字符识别。这种多步骤的方法往往会在每一个分解步骤带来一定的累积误差,且这种误差在后续步骤中都无法弥补,因此在识别准确率上会有瓶颈。另一方面,多步骤的方法在实现上也更复杂,很难达到较好的识别效果。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种字符识别模型训练方法、装置和系统以及一种字符识别方法、装置和系统以及存储介质。
根据本发明一方面,提供了一种字符识别模型训练方法。该方法包括:获取至少一个样本图像和至少一个样本图像各自对应的标注数据,每个样本图像所对应的标注数据用于指示该样本图像的实际字符区域的位置以及实际字符区域中的实际字符;对于至少一个样本图像中的每个样本图像,将该样本图像输入字符识别模型中的区域定位网络,以确定该样本图像的预测字符区域的位置;对于至少一个样本图像中的每个样本图像,将预测字符区域的位置对应的图像信息输入字符识别模型中的字符识别网络,以识别预测字符区域中的预测字符;以及至少利用至少一个样本图像各自对应的标注数据和预测字符对字符识别模型进行训练。
示例性地,至少利用至少一个样本图像各自对应的标注数据和预测字符对字符识别模型进行训练包括:基于至少一个样本图像各自对应的预测字符区域和实际字符区域计算第一损失函数;基于至少一个样本图像各自对应的预测字符和实际字符计算第二损失函数;基于第一损失函数和第二损失函数计算总损失函数;以及调整字符识别模型中的参数以优化损失函数,以获得经训练的字符识别模型。
示例性地,第一损失函数L1根据以下公式计算:
第二损失函数L2根据以下公式计算:
总损失函数L根据以下公式计算:
L=α*L1+L2;
其中,α为预设权重参数,M为至少一个样本图像的数目,n为字符区域的顶点个数,为第i个样本图像的实际字符区域中的第j个顶点的实际坐标值,为第i个样本图像的预测字符区域中的第j个顶点的预测坐标值,K、C分别为字符序列长度和字符类别数,为第i个样本图像的实际字符中的第k个字符属于第c个类别的实际概率值,为第i个样本图像的预测字符中的第k个字符属于第c个类别的预测概率值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711447862.9/2.html,转载请声明来源钻瓜专利网。





