[发明专利]一种光学字符识别方法有效
申请号: | 201911272032.6 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111046872B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 王冲;张永鹏;武亚飞 | 申请(专利权)人: | 深圳市杰恩世智能科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 光学 字符 识别 方法 | ||
本发明公开了一种光学字符识别方法,具体包括:获取字符候选区域、对图像进行倾斜校正、提取一行字符图像、提取单字符图像以及识别提取的字符,本发明对字符背景明暗变化比较鲁棒,且对点阵字符和粘连字符也能进行正确分割,提高了字符分割的准确性。
技术领域
本发明涉及光学字符识别技术领域,具体涉及一种光学字符识别方法。
背景技术
人类的生产过程、日常生活以及商业活动,会产生大量的数据,例如:3C行业产品、通讯行业产品、半导体产品、汽车电子行业、锂电行业、消费类电子行业、机器制造行业、印刷行业、生活用品行业、烟草行业、医药行业、PCB/FPCB行业、液晶面板行业、LED行业等等。这些数据以文本、图像等形式存在于网络和各种数据库中。为了获取图像中的文本信息,需要对图像进行分析,分割图像中的字符,然后识别分割后的单字符图像,从而获取图像包含的信息。在单字符分割领域比较常用的方法有:1、先对图像二值化,然后进行腐蚀、膨胀处理并获取字符;2、基于来连通域分析的方法对图像进行分割获取字符等。上述方法对于背景明暗变化、字符粘连、点阵字符等情况不能很好的解决。
在工业自动化中,字符识别需要在各种复杂环境下稳定快速的识别各式各样的字符。上述背景明暗变化和字符粘连问题对字符分割的影响更加突出。
发明内容
本发明所要解决的技术问题是一种光学字符识别方法,对字符背景明暗变化比较鲁棒,且对点阵字符和粘连字符也能进行正确分割,能够提高字符分割的准确性。
本发明是通过以下技术方案来实现的:一种光学字符识别方法,包括:
基于笔画宽度变换提取候选字符区域图像;
对上述候选字符图像进行倾斜校正,包括行字符倾斜和斜体字;
对上述校正后的图像进行水平方向投影,提取一行字符图像;
对所述行字符图像进行垂直投影,提取多个单字符图像;
对所述单字符图像进行识别,得到图像中的文本信息。
作为优选的技术方案,上述字符识别方法包含如下特点,所述基于笔画宽度变换获取候选字符区域包括:设置笔画宽度,字符高度,字符宽度;
对图像放缩进行放缩操作,使字符大小放缩到目标尺寸,提升字符检测速度;
对图像进行边缘检测,计算每个像素边缘像素点的梯度方向;
对任意一个边缘像素点p,假设Dp为其梯度方向,按照梯度方向,沿着路线r=p+n*Dp(n>0)寻找另一个边缘像素点q,Dq为该边缘点的梯度方向,Dq方向和Dp方向大致相反
寻找到满足条件的点对,计算两点间的距离;如果没有找到q或者二者的梯度方向不是相反的,则继续循环上述步骤寻找下一个点对;
当像素点p和像素点q之间的距离与设定笔画宽度的差值小于阈值(设定笔画宽度的1~2倍),保留该点对以及两点连线上的像素点;
循环上述步骤遍历所有边缘像素点,将所有满足条件的点对连线图像作为字符候选区域。
作为优选的技术方案,上述字符识别方法包含如下特点,所述对候选字符图像进行倾斜校正包括:
对所述字符候选区域图像进行膨胀处理,将可能的断裂字符连接起来,其中模板宽度设置的笔画宽度大小;
对上述膨胀后的图像进行连通域分析,计算每个连通域的外接矩形;
根据设定的字符高度、宽度,对上述外接矩形进行筛选,并按照矩形框垂直方向的位置信息把所有矩形框分成多行;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市杰恩世智能科技有限公司,未经深圳市杰恩世智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911272032.6/2.html,转载请声明来源钻瓜专利网。