[发明专利]模型训练、文本识别方法、装置、电子设备和介质有效

申请号：	202110754737.2	申请日：	2021-07-05
公开（公告）号：	CN113205160B	公开（公告）日：	2022-03-04
发明（设计）人：	王翔;秦勇	申请（专利权）人：	北京世纪好未来教育科技有限公司
主分类号：	G06V30/19	分类号：	G06V30/19;G06V30/41;G06K9/62
代理公司：	北京开阳星知识产权代理有限公司 11710	代理人：	祝乐芳
地址：	100089 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型训练文本识别方法装置电子设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开涉及一种模型训练、文本识别方法、装置、电子设备和介质；其中，该方法包括：获取训练样本，训练样本包括文本图像；将训练样本输入初始识别模型，根据初始识别模型的输出结果确定训练样本中每个字符与预先构建的多级字典的匹配值；根据每个字符与预先构建的多级字典的匹配值，确定目标文本；基于预设损失函数，根据目标文本对初始识别模型进行训练，得到训练后的文本识别模型。本公开实施例能够有效提高文本识别的准确性。

技术领域

本公开涉及人工智能技术领域，尤其涉及一种模型训练、文本识别方法、装置、电子设备和介质。

背景技术

自然场景文字识别是从带文字的图片中识别出字符序列的过程（对于中文，一个字符便是一个汉字，对于英文，一个字符便是一个字母）；识别过程中，除了图片背景复杂以及光照变化等因素外，识别输出空间的复杂性也是一大困难，由于文字由数量是由不固定的字母组成，因此，自然场景文字识别需要从图片中识别长度不固定的序列。

目前文字识别的主要方法是通过整体分析策略实现，即先将待识别文本图像编码，再进行序列解码直接得出整个字符串；但在具体应用过程中，其会出现识别结果多识别或漏识别字符的问题，导致文本识别准确度较低。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种模型训练、文本识别方法、装置、电子设备和介质。

第一方面，本公开提供了一种文本识别模型训练方法，包括：

获取训练样本，所述训练样本包括文本图像；

将所述训练样本输入初始识别模型，根据所述初始识别模型的输出结果确定所述训练样本中每个字符与预先构建的多级字典的匹配值；

根据所述每个字符与预先构建的多级字典的匹配值，确定目标文本；

基于预设损失函数，根据所述目标文本对所述初始识别模型进行训练，得到训练后的文本识别模型。