[发明专利]文本识别模型的训练方法、文本识别方法、装置及设备在审
申请号: | 202210729166.1 | 申请日: | 2022-06-24 |
公开(公告)号: | CN115331237A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 黎安 | 申请(专利权)人: | 联仁健康医疗大数据科技股份有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V10/82 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 高艳红 |
地址: | 200131 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 模型 训练 方法 装置 设备 | ||
1.一种文本识别模型的训练方法,其特征在于,包括:
获取第一文本识别模型,其中,所述第一文本识别模型中包括编码模块和解码模块;
对所述第一文本识别模型进行训练,在所述第一文本识别模型的训练过程达到第一训练条件的情况下,将所述解码模块中的网络层减少至目标数量,得到第二文本识别模型;
对所述第二文本识别模型进行训练,在所述第二文本识别模型的训练过程达到第二训练条件的情况下,基于轻量化编码模块替换所述第二文本识别模型中的编码模块,得到第三文本识别模型,其中,所述轻量化编码模块的网络层数小于所述第二文本识别模型中的编码模块的网络层数;
对所述第三文本识别模型进行训练,在所述第三文本识别模型的训练过程达到第三训练条件的情况下,得到训练完成的文本识别模型。
2.根据权利要求1所述的方法,其特征在于,在对所述第一文本识别模型进行训练之前,所述方法还包括:
获取初始训练样本集,其中,所述初始训练样本包括样本图像和文本标签形成的训练数据,所述样本图像为包括文本信息的图像;
对所述初始训练样本集中的样本图像进行增强处理,得到各样本图像的增强图像,将所述增强图像与所述样本图像的文本标签形成训练数据,添加到初始训练样本集中,得到增强训练样本集,其中,所述增强训练样本集用于对所述第一文本识别模型和所述第二文本识别模型进行训练,所述初始训练样本集用于对所述第三文本识别模型进行训练。
3.根据权利要求1所述的方法,其特征在于,将所述解码模块中的网络层减少至目标数量,得到第二文本识别模型,包括:
在所述解码模块中随机确定目标数量的网络层,并保持所述目标数量的网络层的网络参数,组成新的解码模块。
4.根据权利要求1所述的方法,其特征在于,将所述解码模块中的网络层减少至目标数量,得到第二文本识别模型,包括:
根据所述解码模块中各网络层对应的网络参数,确定各网络层的重要性,根据各网络层的重要性从所述解码模块中各网络层中确定目标数量的网络层,组成新的解码模块。
5.根据权利要求1所述的方法,其特征在于,所述第一文本识别模型和所述第二文本识别模型基于第一学习率进行训练,所述第三文本识别模型基于所述第一学习率和第二学习率分别进行不同阶段的训练,其中,所述第二学习率小于所述第一学习率。
6.根据权利要求1所述的方法,其特征在于,在所述第三文本识别模型的训练过程达到第三训练条件的情况下,所述方法还包括:
对训练后的第三文本识别模型中各网络层的卷积通道进行剪枝处理。
7.根据权利要求1所述的方法,其特征在于,所述文本识别模型中还包括循环网络模块和线性网络模块,其中,循环网络模块设置在所述编码模块和所述解码模块之间,所述线性网络模块设置在所述解码模块之后。
8.一种文本识别方法,其特征在于,包括:
接收待识别图像;
将所述待识别图像输入至预先训练的文本识别模型中,得到所述待识别图像中的文本信息,其中,所述文本识别模型基于所述权利要求1-7任一所述的文本识别模型训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联仁健康医疗大数据科技股份有限公司,未经联仁健康医疗大数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210729166.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:芯粒转移装置及方法
- 下一篇:一种天然气井泡排剂投用多形状投放装置