[发明专利]字符识别方法、装置、电子设备及存储介质在审
申请号: | 201911036151.1 | 申请日: | 2019-10-29 |
公开(公告)号: | CN110866529A | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | 郑岩;胡益清 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 汪阮磊 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 装置 电子设备 存储 介质 | ||
1.一种字符识别方法,其特征在于,包括:
获取待检测的字符图像;
从所述字符图像中提取特征信息;
根据所述特征信息对字符图像修正处理,得到修正字符图像,所述修正字符图像内包含字符;
基于所述字符的位置对所述字符图像进行分割,得到结构字符图像块和非结构字符图像块;
对所述结构字符图像块进行字符识别,得到目标单字符,以及对所述非结构图像块进行字符识别,得到目标字符;
对所述目标单字符和所述目标字符进行合并,得到目标数据。
2.根据权利要求1所述的字符识别方法,其特征在于,根据所述特征信息对字符图像修正处理,得到修正字符图像包括:
根据所述特征信息确定每个字符的候选外接矩形;
从所述候选外接矩形筛选出面积大于第一预设阈值的外接矩形,得到字符外接矩形;
获取存在交集区域的字符外接矩形对,以及获取交集区域与字符外接矩形对中的笔迹外接矩形之间的比值;
将所述比值大于第二预设阈值的字符外接矩形对进行合并,得到修正字符图像。
3.根据权利要求1所述的字符识别方法,其特征在于,所述字符包括结构字符和非结构字符,基于所述字符的位置对所述字符图像进行分割,得到结构字符图像和非结构字符图像包括:
基于所述字符的位置检测所述字符图像中是否存在结构字符;
当所述字符图像中存在结构字符时,根据所述结构字符的位置从所述字符图像中提取结构字符区域,得到结构字符图像;
根据所述结构字符的位置,将所述字符图像中的结构字符区域替换为占位字符区域,得到非结构字符图像。
4.根据权利要求3所述的字符识别方法,其特征在于,基于所述字符的位置检测所述字符图像中是否存在结构字符之后,所述方法还包括:
当所述字符图像中不存在结构字符时,通过预设识别模型对所述字符图像进行字符识别。
5.根据权利要求3所述的字符识别方法,其特征在于,所述占位字符区域内包含占位字符,所述对所述目标单字符和所述目标字符进行合并,得到目标数据包括:
获取所述结构字符图像块内结构字符的第一位置,以及获取所述非结构图像块内占位字符的第二位置;
根据所述第一位置组合所述目标单字符,得到目标结构字符;
根据所述第二位置,将所述占位字符替换为目标结构字符,得到目标数据。
6.根据权利要求1所述的字符识别方法,其特征在于,对所述结构字符图像块进行字符识别,得到目标单字符,以及对所述非结构图像块进行字符识别,得到目标字符包括:
通过预设识别模型对所述结构字符图像进行字符识别,得到目标单字符,以及通过预设识别模型对所述非结构图像块进行字符识别得到目标字符;
所述通过预设识别模型对所述结构字符图像块进行字符识别之前,所述方法还包括:
获取训练样本图像,以及所述训练样本图像对应的目标样本字符;
对所述训练样本图像进行预处理,得到预处理后的训练样本图像;
通过识别模型对训练样本图像和预处理后的训练样本图像进行识别,得到样本字符;
对所述目标样本字符与样本字符进行收敛,以调整所述识别模型的参数,得到预设识别模型。
7.根据权利要求1至6任一项所述的字符识别方法,其特征在于,所述从所述字符图像中提取特征信息包括:
将所述字符图像转换为灰度图像;
获取所述灰度图像中每个像素点的预设邻域内的像素均值;
根据所述像素均值为所述灰度图像中的每个像素点设置二值化阈值;
根据所述二值化阈值确定所述灰度图像对应的二值化图像;
从所述二值化图像中提取特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911036151.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水性聚氨酯底涂剂的合成方法
- 下一篇:一种新型爬壁机器人