[发明专利]文本识别方法和装置有效

申请号：	202110883338.6	申请日：	2021-08-03
公开（公告）号：	CN113344014B	公开（公告）日：	2022-03-08
发明（设计）人：	刘军;秦勇	申请（专利权）人：	北京世纪好未来教育科技有限公司
主分类号：	G06V30/414	分类号：	G06V30/414;G06V30/148;G06V30/18;G06V30/19;G06K9/62;G06N3/04
代理公司：	北京北汇律师事务所 11711	代理人：	李英杰
地址：	100086 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供一种文本识别方法和装置，属于图像处理领域。所述方法包括：获取待识别的目标文本图像；根据预设的切分规则，将所述目标文本图像切分为设定数目个第一子图像；调用训练后的图像特征提取模型，分别对所述设定数目个第一子图像进行处理，得到每个第一子图像的第一子图像特征；根据预设的整合规则，对所述每个第一子图像的第一子图像特征进行处理，确定所述目标文本图像的第一图像特征；调用训练后的文本识别模型，对所述第一图像特征进行处理，确定识别的目标文本。采用本公开，可以提高文本识别的准确性。

技术领域

本公开涉及图像处理领域，尤其涉及一种文本识别方法和装置。

背景技术

自然场景文本识别是带文字的图片中识别出字符序列的过程。对于中文，一个字符便是一个汉字；对于英文，一个字符便是一个字母。

它是一项具有极大挑战性的课题，除了图片背景复杂，光照变化等因素外，识别输出空间的复杂性也是一大困难，由于文本由数量不固定的字母组成，因此，自然场景文本识别需要从图片中识别长度不固定的序列。目前的解决思路是，基于整体分析的策略，即序列到序列的方法，先将整个图像进行编码，然后进行序列解码逐个输出字符，进而将各个字符进行拼接，得到识别的文本。

但是，上述方法可能存在的多识别字符或漏识别字符的情况较多，导致文本识别的准确性较低。因此，亟需一种文本识别方法来克服上述问题。

发明内容

为了解决现有技术的问题，本公开实施例提供了一种文本识别方法和装置。技术方案如下：

根据本公开的一方面，提供了一种文本识别方法，所述方法包括：

获取待识别的目标文本图像；

根据预设的切分规则，将所述目标文本图像切分为设定数目个第一子图像；

调用训练后的图像特征提取模型，分别对所述设定数目个第一子图像进行处理，得到每个第一子图像的第一子图像特征；

根据预设的整合规则，对所述每个第一子图像的第一子图像特征进行处理，确定所述目标文本图像的第一图像特征；

调用训练后的文本识别模型，对所述第一图像特征进行处理，确定识别的目标文本。

根据本公开的另一方面，提供了一种文本识别装置，所述装置包括：

获取模块，用于获取待识别的目标文本图像；

切分模块，用于根据预设的切分规则，将所述目标文本图像切分为设定数目个第一子图像；