[发明专利]文本识别方法、文本识别模型的训练方法及装置有效

申请号：	202111560326.6	申请日：	2021-12-20
公开（公告）号：	CN114283411B	公开（公告）日：	2022-11-15
发明（设计）人：	章成全;吕鹏原;姚锟;韩钧宇;刘经拓	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06V30/14	分类号：	G06V30/14;G06V30/18;G06V10/764;G06V10/82;G06N3/04;G06N3/08
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	马姣琴;黄健
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法模型训练装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种文本识别方法、文本识别模型的训练方法及装置，应用于工智能技术领域，具体为深度学习、计算机视觉技术领域，文本识别方法包括：获取待识别图像的图像序列特征，对所述图像序列特征进行解码处理，得到待识别图像的全量的文本字符串，对文本字符串进行语义增强处理，得到文本序列特征，其中，图像序列特征、文本字符串与文本序列特征的长度相同，根据文本字符串和文本序列特征，确定待识别图像的文本内容，使得识别过程更加全面和完善，不仅充分考虑了用以确定文本内容的元素的完整性和全面性，且考虑了用以确定文本内容的元素在语义理解层面的内容，从而实现了文本识别的准确性、有效性、以及可靠性的技术效果。

技术领域

本公开涉及人工智能技术领域，具体为深度学习、计算机视觉技术领域，可应用于光学字符识别(Optical Character Recognition，OCR)等场景，尤其涉及一种文本识别方法、文本识别模型的训练方法及装置。

背景技术

光学字符识别被广泛的应用于各领域，是指电子设备检查纸上打印的字符，通过检测和字符识别方法的方式翻译成计算机文字的过程。

基于注意力机制(Attention)是光学字符识别的典型性方法之一，且Attention最具代表性的实现方法是基于识别的结果指导矫正网络(ASTER)，该方法通过注意力增强以及历史识别内容进行强化得到待识别图像中的文本内容。

然而，当待识别图像中的文本较长时，容易出现误差积累，导致文本识别的准确性偏低。

发明内容

本公开提供了一种用于提高文本识别的准确性的文本识别方法、文本识别模型的训练方法及装置。

根据本公开的第一方面，提供了一种文本识别方法，包括：

获取待识别图像的图像序列特征，对所述图像序列特征进行解码处理，得到所述待识别图像的全量的文本字符串；

对所述文本字符串进行语义增强处理，得到文本序列特征，其中，所述图像序列特征、所述文本字符串与所述文本序列特征的长度相同；

根据所述文本字符串和所述文本序列特征，确定所述待识别图像的文本内容。