[发明专利]字符识别模型生成方法、装置、计算机设备和存储介质有效
申请号: | 202110787681.0 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113469092B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 孙鲲;姚旭峰;沈小勇;吕江波 | 申请(专利权)人: | 深圳思谋信息科技有限公司;上海思谋科技有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/18;G06V30/19;G06T7/62;G06T7/64;G06V10/82 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 樊倩 |
地址: | 518051 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 模型 生成 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种字符识别模型生成方法、装置、计算机设备和存储介质,方法包括:获取多个已识别字符数据集与待识别字符数据集之间的相似度,将与待识别字符数据集之间的相似度匹配的已识别字符数据集,作为目标字符数据集;获取与目标字符数据集对应的预训练模型,根据预训练模型构建目标训练模型;预训练模型为经过预先训练后的用于识别目标字符数据集的模型;根据已识别字符数据集与待识别字符数据集,生成目标训练数据集;根据目标训练数据集,对目标训练模型进行训练,得到与待识别字符数据集对应的字符识别模型。本申请字符数据集之间的相似度,实现了在模型训练时进行学习迁移,从而提高了字符识别模型的生成效率。
技术领域
本申请涉及计算机识别技术领域,特别是涉及一种字符识别模型生成方法、装置、计算机设备和存储介质。
背景技术
随着工业的发展,越来越多的生产场景开始通过字符识别模型来识别生产设备、生产产品等上的字符信息。
但是,针对不同的生产场景往往需要从头开始训练字符识别模型,字符识别模型训练的周期较长,训练所需的数据较多,字符识别生成的效率还较低。
发明内容
基于此,有必要针对上述技术问题,提供一种字符识别模型生成方法、装置、计算机设备和存储介质。
一种字符识别模型生成方法,包括:
获取多个已识别字符数据集与待识别字符数据集之间的相似度,将与所述待识别字符数据集之间的相似度匹配的已识别字符数据集,作为目标字符数据集;
获取与所述目标字符数据集对应的预训练模型,根据所述预训练模型构建目标训练模型;所述预训练模型为经过预先训练后的用于识别所述目标字符数据集的模型;
根据所述已识别字符数据集与所述待识别字符数据集,生成目标训练数据集;根据所述目标训练数据集,对所述目标训练模型进行训练,得到与所述待识别字符数据集对应的字符识别模型。
在其中一个实施例中,所述已识别字符数据集与待识别字符数据集均携带有图片参数信息以及文本轮廓信息;
所述获取多个已识别字符数据集与待识别字符数据集之间的相似度,包括:
根据所述已识别字符数据集携带的图片参数信息,以及所述待识别字符数据集携带的图片参数信息,得到所述已识别字符数据集与所述待识别字符数据集之间的图片参数相似度;
根据所述已识别字符数据集携带的文本轮廓信息,以及所述待识别字符数据集携带的文本轮廓信息,得到所述已识别字符数据集与所述待识别字符数据集之间的文本轮廓相似度;
将所述图片参数相似度与所述文本轮廓相似度进行加权处理,根据加权处理的结果确定所述已识别字符数据集与所述待识别字符数据集之间的相似度。
在其中一个实施例中,所述根据所述已识别字符数据集携带的图片参数信息,以及所述待识别字符数据集携带的图片参数信息,得到所述已识别字符数据集与所述待识别字符数据集之间的图片参数相似度包括:
获取所述已识别字符数据集与待识别字符数据集中,所有图像的色彩通道均值以及宽高均值;
根据所述色彩通道均值和所述宽高均值,确定所述已识别字符数据集与待识别字符数据集的色彩通道均值的余弦距离,以及所述已识别字符数据集与待识别字符数据集的宽高均值的余弦距离;
将所述色彩通道均值的余弦距离与所述宽高均值的余弦距离之和,作为所述图片参数相似度。
在其中一个实施例中,所述根据所述已识别字符数据集携带的文本轮廓信息,以及所述待识别字符数据集携带的文本轮廓信息,得到所述已识别字符数据集与所述待识别字符数据集之间的文本轮廓相似度,包括:
识别所述已识别字符数据集与所述待识别字符数据集中,文本信息对应的轮廓特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳思谋信息科技有限公司;上海思谋科技有限公司,未经深圳思谋信息科技有限公司;上海思谋科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110787681.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型光纤耦合器
- 下一篇:一种铝基中间层合金及其制备方法与应用