[发明专利]文字检测模型获取方法、装置、存储介质及计算机设备在审
申请号: | 202211329352.2 | 申请日: | 2022-10-27 |
公开(公告)号: | CN115620293A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 卞晓瑜;肖鸣林;黄俊 | 申请(专利权)人: | 壹沓科技(上海)有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19;G06V10/82 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 孔祥玥 |
地址: | 200040 上海市静*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 检测 模型 获取 方法 装置 存储 介质 计算机 设备 | ||
本申请提供了一种文字检测模型获取方法、装置、存储介质及计算机设备,所述方法包括:从预先设置的训练配置文件中获取模板类型、待生成样本数量、预设的模型选取规则、预设的模型训练规则和多个待训练模型的模型参数;根据所述模板类型生成N组样本数据,N为所述待生成样本数量;针对每个所述待训练模型的模型参数,根据该待训练模型的模型参数获取目标待训练模型,并采用所述N组样本数据对所述目标待训练模型进行训练,直至所述目标待训练模型的输出数据满足所述模型训练规则,以得到训练后的模型;从多个训练后的模型中筛选出满足所述模型选取规则的模型,并将满足所述模型选取规则的模型作为所述文字检测模型。本申请可降低模型获取成本。
技术领域
本申请涉及计算机技术领域,尤其涉及一种文字检测模型获取方法、装置、存储介质及计算机设备。
背景技术
在票据或证照等固定版式的图像文字识别场景中,文字识别系统可包括文字检测模型和文字识别模型。其中,文字检测模型是文字识别系统的基础模型,用于检测图像中的属性字段及该属性字段所对应的文字位置。文字检测模型可将检测得到的文字位置提供给文字识别模型,以通过文字识别模型识别该文字位置所对应的文字内容。而后结合文字识别模型输出的文字内容和文字检测模型输出的属性字段,从而可从固定版式的图像中提取有效的业务字段内容,并最终提供给业务使用。
然而,经发明人研究发现,目前在获取文字检测模型的过程中需要投入大量的人力成本、财力成本和时间成本,存在成本过高的问题。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中成本过高的技术缺陷。
第一方面,本申请实施例提供了一种文字检测模型获取方法,所述方法包括:
从预先设置的训练配置文件中获取模板类型、待生成样本数量、预设的模型选取规则、预设的模型训练规则和多个待训练模型的模型参数;
根据所述模板类型生成N组样本数据,其中,N为所述待生成样本数量;
针对每个所述待训练模型的模型参数,根据该待训练模型的模型参数获取目标待训练模型,并采用所述N组样本数据对所述目标待训练模型进行训练,直至所述目标待训练模型的输出数据满足所述模型训练规则,以得到训练后的模型;
从多个训练后的模型中筛选出满足所述模型选取规则的模型,并将满足所述模型选取规则的模型作为所述文字检测模型。
在其中一个实施例中,所述模型选取规则用于选取精确率最高的模型、召回率最高的模型或者准确率最高的模型。
在其中一个实施例中,所述根据所述模板类型生成N组样本数据的步骤,包括:
从预设的模板库中分别确定所述模板类型所对应的初始模板图像和所述初始模板图像所对应的模板配置信息;其中,所述模板配置信息包括由人工标注的各个关键字段和各个所述关键字段在初始模板图像中对应的值字段填写位置;
针对每个所述关键字段,根据该关键字段,从预设的多个语料库中确定目标语料库,并从所述目标语料库中选取该关键字段所对应的N个替换语料;
根据所述初始模板图像、各个所述值字段填写位置和每个所述关键字段所对应的N个替换语料,生成N组样本数据,每组样本数据包括样本图像。
在其中一个实施例中,所述根据所述初始模板图像、各个所述值字段填写位置和每个所述关键字段所对应的N个替换语料,生成N组样本数据的步骤,包括:
在已生成样本数据组数M小于所述待生成样本数量时,根据各个所述关键字段所对应的值字段填写位置,分别将各个所述关键字段所对应的第(M+1) 个替换语料融合到所述初始模板图像中,以得到第(M+1)张样本图像,并根据所述第(M+1)张样本图像得到第(M+1)组样本数据,且更新所述已生成样本数据组数,直至更新后的所述已生成样本数据组数大于或等于所述待生成样本数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于壹沓科技(上海)有限公司,未经壹沓科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211329352.2/2.html,转载请声明来源钻瓜专利网。