[发明专利]字符识别模型训练方法、装置及设备在审
申请号: | 201910645222.1 | 申请日: | 2019-07-17 |
公开(公告)号: | CN112241749A | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 徐博 | 申请(专利权)人: | 上海高德威智能交通系统有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王叶娟 |
地址: | 201203 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 模型 训练 方法 装置 设备 | ||
本发明提供一种字符识别模型训练方法、装置及设备,该方法包括:从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;将选择的未标注图像输入至字符识别模型,得到输入至字符识别模型的每一未标注图像的预测字符识别结果;所述字符识别模型是根据所述图像样本集中的已标注图像训练得到的;针对输入至所述字符识别模型的每一未标注图像,根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,得到已标注图像;根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型。可提升标注效率,进而提升模型训练效率。
技术领域
本发明涉及机器视觉技术领域,尤其涉及的是一种字符识别模型训练方法、装置及设备。
背景技术
随着科学技术的发展,深度学习算法在分类、检测、识别等任务中表现优异。在字符识别技术中,将图像输入到已训练的字符识别模型中,以通过字符识别模型对图像中的字符进行识别。实现此技术的前提是,需要利用大量样本训练出字符识别模型。
现有的字符识别模型训练方式中,采集到大量图像后,需要人为地一一标注图像中各字符的标签,再利用标注好标签的所有图像训练出所需的字符识别模型。
上述方式中,由于模型训练需要大量样本,而且每张图像中还可能有大量的字符,所以需要人为标注的标签很多,标注效率过低,导致模型训练效率低。
发明内容
有鉴于此,本发明提供一种字符识别模型训练方法、装置及设备,可提升标注效率,进而提升模型训练效率。
本发明第一方面提供一种字符识别模型训练方法,包括:
从图像样本集中选择未标注图像;所述图像样本集包括已标注图像和未标注图像;
将选择的未标注图像输入至字符识别模型,得到输入至字符识别模型的每一未标注图像的预测字符识别结果;所述字符识别模型是根据所述图像样本集中的已标注图像训练得到的;
针对输入至所述字符识别模型的每一未标注图像,根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,得到已标注图像;
根据所述图像样本集中的已标注图像和所述字符识别模型训练出目标字符识别模型。
根据本发明的一个实施例,从所述图像样本集中选择未标注图像,包括:
如果所述图像样本集中未标注图像的数量大于等于设定数量,从所述图像样本集中选择设定数量个未标注图像;
如果所述图像样本集中未标注图像的数量小于设定数量,从所述图像样本集中选择剩余所有未标注图像。
根据本发明的一个实施例,
所述预测字符识别结果包括未标注图像中各字符的预测字符信息;
所述根据该未标注图像的预测字符识别结果对所述图像样本集中的该未标注图像进行标注,包括:
依据该未标注图像的预测字符识别结果中的预测字符信息确定该未标注图像中各字符被预测的字符标签;
针对该未标注图像中每一字符,确定该字符是否被预测出正确的字符标签,如果是,确定该字符标签为该字符的目标标签,如果否,重新确定一个字符标签作为该字符的目标标签;
依据该未标注图像中各字符的目标标签,对所述图像样本集中的该未标注图像进行标注,得到已标注图像。
根据本发明的一个实施例,确定该字符是否被预测出正确的字符标签,包括:
接收外部输入的指令;所述指令携带字符未被预测出正确的字符标签的指示信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海高德威智能交通系统有限公司,未经上海高德威智能交通系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910645222.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模块化的轨道车辆限界测试装置和测试方法
- 下一篇:薄膜制备设备