[发明专利]基于直方图和超像素的场景图像文字检测方法及系统有效
申请号: | 201410168244.0 | 申请日: | 2014-04-24 |
公开(公告)号: | CN103942797B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 张永铮;周宇 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 北京轻创知识产权代理有限公司11212 | 代理人: | 杨立 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于直方图和超像素的场景图像文字检测方法,包括步骤1对目标图片中可能存在的文字的笔画宽度值进行估计,基于笔画宽度值生成一个笔画直方图;步骤2对目标图片进行边缘检测,进行比对和修正,得到边缘检测质量最高的连通域;步骤3对连通域进行骨架化,得到骨架像素;根据骨架像素估算高精度笔画宽度;步骤4根据高精度笔画宽度过滤字符与非字符;步骤5通过连通域的空间分布利用几何约束进一步过滤字符与非字符,过滤文本行和非文本行;步骤6完成对目标图片中对字符和文本行的检测。本发明提出一种高速和高精度的笔画宽度计算方法,以提高文字与非文字连通域过滤的精度和效率。 | ||
搜索关键词: | 基于 直方图 像素 场景 图像 文字 检测 方法 系统 | ||
【主权项】:
基于直方图和超像素的场景图像文字检测方法,其特征在于,具体包括以下步骤:步骤1:对目标图片中可能存在的文字宽度值进行估计得到笔画宽度值,基于笔画宽度值生成一个笔画直方图;步骤2:将笔画直方图中的笔画宽度值设置为超像素的步长参数;对目标图片进行边缘检测,将上述设定了步长参数的超像素与边缘检测的结果进行比对和修正,得到在所述笔画宽度值的情况下,边缘检测质量最高的连通域;步骤3:对连通域进行骨架化,得到骨架像素;根据骨架像素对笔画宽度值进行估算得到高精度笔画宽度;步骤4:根据高精度笔画宽度对目标图片进行过滤,区分字符与非字符,得到字符;步骤5:通过连通域的空间分布利用几何约束进一步对得到的字符进行过滤,得到精准字符,并基于精准字符区分目标图片中文本行和非文本行,得到文本行;步骤6:完成对目标图片中精准字符和文本行的检测;所述步骤2具体包括以下步骤:步骤2.1:选择笔画直方图中频率较大的几个笔画宽度值作为超像素的搜索步长值;步骤2.2:查找得到间隔大小为搜索步长值的格点,选择该格点附近梯度最小的位置作为超像素的初始质心;步骤2.3:迭代执行步骤2.1和2.2,更新并计算出各个超像素在图片上的实际质心和边界;步骤2.4:降低Canny边缘检测算子的阈值,检测图片的新的大范围边缘;步骤2.5:将大范围边缘与超像素的边界进行比对和修正,对修正后的大范围边缘去除与当前笔画宽度不同的干扰,得到满足笔画宽度规律的图片的大范围边缘;步骤2.6:对图片的大范围边缘进行连通域分析,计算大范围边缘的欧式距离变换图,得到在所述笔画宽度值的情况下,边缘检测质量最高的连通域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410168244.0/,转载请声明来源钻瓜专利网。