[发明专利]字符识别方法、装置、电子设备及存储介质在审

申请号：	201911036151.1	申请日：	2019-10-29
公开（公告）号：	CN110866529A	公开（公告）日：	2020-03-06
发明（设计）人：	郑岩;胡益清	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06K9/34	分类号：	G06K9/34
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	汪阮磊
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	字符识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了一种字符识别方法、装置、电子设备及存储介质，本申请实施例首先获取待检测的字符图像，并从字符图像中提取特征信息，然后根据特征信息对字符图像修正处理，得到修正字符图像，修正字符图像内包含字符，其次基于字符的位置对字符图像进行分割，得到结构字符图像块和非结构字符图像块，再对结构字符图像块进行字符识别，得到目标单字符，对非结构图像块进行字符识别，得到目标字符，最后对目标单字符和目标字符进行合并，得到目标数据。该方案对字符图像进行修正，以及对字符图像分割，并对分割得到的结构字符图像块和非结构图像块分别识别，提高了对字符识别的准确率。

技术领域

本申请涉及图像处理技术领域，具体涉及一种字符识别方法、装置、电子设备及存储介质。

背景技术

随着图像处理技术的发展，字符识别作为该领域的重要应用，愈发受到重视。字符识别可以将存在于图像等介质上的字符转化为可通过电子设备编辑的字符形式。以公式识别为例，现有的公式识别方法，通常对公式图像中的字符进行简单分割得到若干单字符，并直接对该单字符进行识别，进而得到识别结果。由于公式内存在的字符粘连、及噪声等因素的影响，导致通过现有技术进行公式识别的识别效果难以保证，识别准确率不高。

发明内容

本申请实施例提供一种字符识别方法、装置、电子设备及存储介质，旨在提高字符识别准确率。

本申请实施例提供的一种字符识别方法，包括：

获取待检测的字符图像；

从所述字符图像中提取特征信息；

根据所述特征信息对字符图像修正处理，得到修正字符图像，所述修正字符图像内包含字符；

基于所述字符的位置对所述字符图像进行分割，得到结构字符图像块和非结构字符图像块；

对所述结构字符图像块进行字符识别，得到目标单字符，以及对所述非结构图像块进行字符识别，得到目标字符；

对所述目标单字符和所述目标字符进行合并，得到目标数据。

在本申请的一些实施例中，所述字符图像内包含特征，根据所述特征信息对字符图像修正处理，得到修正字符图像包括：

根据所述特征信息确定每个字符的候选外接矩形；

从所述候选外接矩形筛选出面积大于第一预设阈值的外接矩形，得到字符外接矩形；