[发明专利]一种光学文字识别方法、装置、设备及存储介质在审

申请号：	202110069984.9	申请日：	2021-01-19
公开（公告）号：	CN112766255A	公开（公告）日：	2021-05-07
发明（设计）人：	刘天赐	申请（专利权）人：	上海微盟企业发展有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/32;G06K9/34;G06K9/62;G06N3/08
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	纪志超
地址：	200441 上海市宝山***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种光学文字识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种光学文字识别方法、装置、设备及存储介质，包括：获取待检测图像的目标文本行；判断所述目标文本行的文本样式，其中，所述文本样式为印刷体文本或手写体文本；基于所述目标文本行的所述文本样式确定目标文本识别模型，并利用所述目标文本识别模型对所述目标文本行进行识别。本申请在对混合文本中的文本样式进行分类的基础上，利用不同的目标文本识别模型对印刷体文本和手写体文本进行文字识别，有效提高了光学文字识别的准确度。

技术领域

本发明涉及计算机技术领域，特别涉及一种光学文字识别方法、装置、设备及存储介质。

背景技术

光学文字识别(OCR，Optical Character Recognition)是在自然光线照射的基础上，对于相机拍摄的文档图片中的文字，利用计算机技术做文字识别的过程，广泛应用于大量文字资料、档案卷宗、文案的录入和银行票据处理等领域。

现有技术中的光学文字识别大多都是针对中文印刷体文本，对于风格多样的手写体中文文字尚未有完善的识别方案，如果将识别印刷体文本中的文字的OCR识别模型直接用于识别手写体文本中的文字，识别精度会急剧下降，相应的，对于手写体和印刷体同时出现的混合文本，目前没有模型能对上述混合文本中的文字进行有效识别，其识别效果受限于模型训练的数据匮乏及其架构设计。

发明内容

有鉴于此，本发明的目的在于提供一种光学文字识别方法、装置、设备及存储介质，能够在对混合文本中的文本样式进行分类的基础上，利用不同的目标文本识别模型对印刷体文本和手写体文本进行文字识别，有效提高光学文字识别准确度。其具体方案如下：

本申请的第一方面提供了一种光学文字识别方法，包括：

获取待检测图像的目标文本行；

判断所述目标文本行的文本样式；其中，所述文本样式为印刷体文本或手写体文本；

基于所述目标文本行的所述文本样式确定目标文本识别模型，并利用所述目标文本识别模型对所述目标文本行进行识别。

可选的，所述获取待检测图像的目标文本行，包括：

利用基于语义分割网络构建的分割模型对所述待检测图像进行分割，以得到所述待检测图像的目标文本行。

可选的，所述利用基于语义分割网络构建的分割模型对所述待检测图像进行分割之后，还包括：

判断所述目标文本行中的文字是否水平对齐，如果否，则调整所述目标文本行中的所述文字至水平对齐，以得到水平对齐的所述目标文本行。

可选的，所述调整所述目标文本行中的所述文字至水平对齐，包括：

根据所述目标文本行中的所述文字的坐标点确定所述目标文本行与水平方向的夹角，并通过仿射变换将所述目标文本行中的所述文字调整至水平方向。