[发明专利]字符识别方法、装置、电子设备及存储介质在审
申请号: | 201911036151.1 | 申请日: | 2019-10-29 |
公开(公告)号: | CN110866529A | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 郑岩;胡益清 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 汪阮磊 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 装置 电子设备 存储 介质 | ||
本申请实施例公开了一种字符识别方法、装置、电子设备及存储介质,本申请实施例首先获取待检测的字符图像,并从字符图像中提取特征信息,然后根据特征信息对字符图像修正处理,得到修正字符图像,修正字符图像内包含字符,其次基于字符的位置对字符图像进行分割,得到结构字符图像块和非结构字符图像块,再对结构字符图像块进行字符识别,得到目标单字符,对非结构图像块进行字符识别,得到目标字符,最后对目标单字符和目标字符进行合并,得到目标数据。该方案对字符图像进行修正,以及对字符图像分割,并对分割得到的结构字符图像块和非结构图像块分别识别,提高了对字符识别的准确率。
技术领域
本申请涉及图像处理技术领域,具体涉及一种字符识别方法、装置、电子设备及存储介质。
背景技术
随着图像处理技术的发展,字符识别作为该领域的重要应用,愈发受到重视。字符识别可以将存在于图像等介质上的字符转化为可通过电子设备编辑的字符形式。以公式识别为例,现有的公式识别方法,通常对公式图像中的字符进行简单分割得到若干单字符,并直接对该单字符进行识别,进而得到识别结果。由于公式内存在的字符粘连、及噪声等因素的影响,导致通过现有技术进行公式识别的识别效果难以保证,识别准确率不高。
发明内容
本申请实施例提供一种字符识别方法、装置、电子设备及存储介质,旨在提高字符识别准确率。
本申请实施例提供的一种字符识别方法,包括:
获取待检测的字符图像;
从所述字符图像中提取特征信息;
根据所述特征信息对字符图像修正处理,得到修正字符图像,所述修正字符图像内包含字符;
基于所述字符的位置对所述字符图像进行分割,得到结构字符图像块和非结构字符图像块;
对所述结构字符图像块进行字符识别,得到目标单字符,以及对所述非结构图像块进行字符识别,得到目标字符;
对所述目标单字符和所述目标字符进行合并,得到目标数据。
在本申请的一些实施例中,所述字符图像内包含特征,根据所述特征信息对字符图像修正处理,得到修正字符图像包括:
根据所述特征信息确定每个字符的候选外接矩形;
从所述候选外接矩形筛选出面积大于第一预设阈值的外接矩形,得到字符外接矩形;
获取存在交集区域的字符外接矩形对,以及获取交集区域与字符外接矩形对中的笔迹外接矩形之间的比值;
将所述比值大于第二预设阈值的字符外接矩形对进行合并,得到修正字符图像。
在本申请的一些实施例中,所述字符包括结构字符和非结构字符,基于所述字符的位置对所述字符图像进行分割,得到结构字符图像和非结构字符图像包括:
基于所述字符的位置检测所述字符图像中是否存在结构字符;
当所述字符图像中存在结构字符时,根据所述结构字符的位置从所述字符图像中提取结构字符区域,得到结构字符图像;
根据所述结构字符的位置,将所述字符图像中的结构字符区域替换为占位字符区域,得到非结构字符图像。
在本申请的一些实施例中,基于所述字符的位置检测所述字符图像中是否存在结构字符之后,所述方法还包括:
当所述字符图像中不存在结构字符时,通过预设识别模型对所述字符图像进行字符识别。
在本申请的一些实施例中,所述占位字符区域内包含占位字符,所述对所述目标单字符和所述目标字符进行合并,得到目标数据包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911036151.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水性聚氨酯底涂剂的合成方法
- 下一篇:一种新型爬壁机器人