[发明专利]一种光学字符识别方法有效
申请号: | 201911272032.6 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111046872B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 王冲;张永鹏;武亚飞 | 申请(专利权)人: | 深圳市杰恩世智能科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 光学 字符 识别 方法 | ||
1.一种光学字符识别方法,其特征在于,具体包括以下几大步骤:、
步骤一、获取字符候选区域;步骤二、对图像进行倾斜校正;步骤三、提取一行字符图像;步骤四、提取单字符图像;步骤五、识别提取的字符;
其中,步骤一、获取字符候选区域:利用笔画宽度变换获取图像中的字符候选区域;
步骤二、对图像进行倾斜校正:根据字符候选区域估计字符的倾斜角度,并对图像进行倾斜校正;
步骤三、提取一行字符图像:对图像进行水平投影,根据水平投影数据和字符高度提取一行字符图像;
步骤四、提取单字符图像:对已提取的行字符图像进行垂直投影,根据垂直投影数据和字符宽度对图像进行分割并提取单字符图像;
步骤五、识别提取的字符。
2.如权利要求1所述的光学字符识别方法,其特征在于:步骤一中,利用笔画宽度变换获取图像中的字符候选区域包括:
(1.1)对图像进行边缘检测,计算每个边缘像素点的方向梯度值;
(1.2)对任意一个边缘像素点p,假设Dy为其梯度方向,按照梯度方向,沿着路线r=P+R*Dy(R>0)寻找另一个边缘像素点q,Dq为该边缘点的梯度方向,Dq方向和Dy方向相反;
(1.3)如果没有找到q或者二者的梯度方向不是相反的,则重新寻找;
(1.4)找到后计算两点间的距离,当像素点p和像素点q之间的距离满足阈值时,保留该点对以及两点连线上的像素点;
(1.5)利用上述方法遍历所有边缘像素,将所有满足条件的点对连线图像作为字符候选区域。
3.如权利要求1所述的光学字符识别方法,其特征在于:步骤二中,对图像进行倾斜校正包括:
(2.1)根据字符的高度和宽度对字符候选区域进行筛选,利用连通域分析的方法计算每个字符区域的外接矩形,按照垂直方向的位置信息把矩形框分成多行,选择矩形数量最多的行;接着按照矩形框之间的距离信息进行聚类,获取聚类数量最多的类别,并提取矩形框的中心点进行直线拟合,直线的角度即为字符行的倾斜角度;
(2.2)如果字体为斜体字时,需要继续对图像进行校正,将上步校正后的图像进行角度为a的错切变换,并进行垂直投影,计算出投影值的最大最小值的差值,并在[-30°,30°],重复该步骤,确定出差值最大的角度,即为斜体字倾斜角度。
4.如权利要求1所述的光学字符识别方法,其特征在于:步骤三中,提取一行字符图像包括:
(3.1)对所述校正后的图像进行水平投影;
(3.2)为了消除背景明暗变化对字符分割的影响,需要对图像进行背景估计,首先对投影数据进行分段,计算每段的最小值,根据这些最小值点对图像背景的明暗程度进行背景估计,然后计算补偿投影数据;
(3.3)使用三个阈值对补偿投影数据进行分析,阈值1提取多行字符候选图像,阈值2(阈值2=阈值1)和阈值3剔除非字符行区域,最后提取一行字符图像。
5.如权利要求1所述的光学字符识别方法,其特征在于:步骤四中,提取单字符图像包括:
(4.1)对上述提取行字符图像进行垂直投影;
(4.2)投影方式与水平投影方式相似,获取投影数据后,结合字符宽度和阈值分析将所述行字符图像分割为多个单字符图像;
(4.3)为了更精确的切合分割每个字符,对单字符图像再次进行垂直投影进行分割,计算单字符图像中字符的精确上下边界,提取精确的单字符图像。
6.如权利要求1所述的光学字符识别方法,其特征在于:步骤五中,识别提取字符包括:
(5.1)对上述分割好的单字符图像进行分类,这里可以使用决策树、神经网络、支持向量机、K最邻近等方法对字符图像进行分类;
(5.2)为了消除噪声影响,先对图像进行放缩、模糊等处理,然后训练相应的字符识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市杰恩世智能科技有限公司,未经深圳市杰恩世智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911272032.6/1.html,转载请声明来源钻瓜专利网。