[发明专利]一种快速多方向文本行检测方法有效
申请号: | 201711385007.X | 申请日: | 2017-12-20 |
公开(公告)号: | CN108154151B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 方承志;樊梦雅;黄梅玲;顾子超 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/26;G06V10/44 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李吉宽 |
地址: | 210023 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 多方 文本 检测 方法 | ||
本发明公开了一种快速多方向文本行检测方法,首先对待检测的自然场景图片采用MSER算法提取候选连通区域;然后对候选连通区域进行连通区域对点算法,得到候选字符区域,并通过连通规则进行分组,应用丢失字符恢复的算法得到候选文本行;最后根据候选多向文本行的特征应用AdaBoost算法进行文本行和非文本行的分类。本发明利用连通区域对点算法,对经过MSER得到的候选连通区域进行处理,降低了计算复杂度,加速了场景文本的提取速度。利用Adaboost算法提取候选多向文本行的特征,可以大大提高文本检测的准确率。
技术领域
本发明属于图像处理技术领域,具体地说涉及的是一种快速的多方向文本行检测方法。
背景技术
随着智能手机和移动拍摄设备的普及,图像的数量越来越多。自然图像中的文本检测具有广泛的应用领域,例如机器人导航,人机交互和图像检索。目前,文档文本检测已经取得了巨大的进步,并且得到了广泛的应用,然而,由于自然场景图像中的文本外观的多样性和背景的复杂性,自然场景中文本的检测依然是一个具有挑战性的任务。
现有的文本检测方法大致可以分为三类:基于纹理的,基于连通区域的和混合方法。在现有的方法中,大多数的方法侧重于检测水平或近似水平方向的文本。这些方法不但严重限制了利用移动设备随意拍摄图像的场景适用性,而且在应用于多方向文本图像时,它们的性能通常急剧下降。而且,大多数的方法时间复杂度较高,检测速度相对较低。如何从复杂的自然场景中快速准确地定位出多方向文本区域,这就是目前自然场景文本检测在图像领域的一个研究热点和难点。
发明内容
本发明的目的在于克服现有技术的不足,提出一种快速的多方向文本行检测方法,该快速的多方向文本行检测方法能够检测任意定向和弯曲的场景文本行,从而提高了自然场景图像中的文本检测的准确度,方便后面的识别处理。同时,大大降低了计算量,提高了文本的检测速度,方法简单有效。
为解决上述技术问题,本发明采用的技术方案为一种快速多方向文本行检测方法,包括如下基本步骤:
步骤一:对待检测的自然场景图片采用MSER算法提取候选连通区域;
步骤二:对候选连通区域进行连通区域对点算法,得到候选字符区域,并通过连通规则进行分组,应用丢失字符恢复的算法得到候选文本行;
步骤三:根据候选多向文本行的特征应用AdaBoost算法进行文本行和非文本行的分类。
进一步,上述步骤二中,所述连通区域对点算法的具体过程如下:在每个候选连通区域上,求得边缘像素点s和梯度方向ds,若s位于笔画边缘,ds一定大致垂直于笔画方向,沿着射线r=s+n*ds(n=0)梯度查找与之对应的另一个边缘像素点t,若 ds与dt的方向满足dt=-ds±π/8,则认为边缘像素点s和t是大致相反的,如果s 找不到对应的匹配的t或者ds与dt不满足大致反向的要求,那么该射线r废弃掉;如果找到满足要求的t,那么边缘像素点s和t都会被指定笔画宽度属性值||s-t||,除非该点已经被指定了一个更小的笔画宽度属性值,计算出所有边缘像素点的笔画宽度值,得到候选字符区域,对得到的候选字符区域进行概率过滤,排除一些明显不可能是字符的区域。
进一步,上述概率过滤的具体过程如下:统计每一个边缘像素点的笔画宽度值,建立坐标轴,横轴代表不同的笔画宽度值,纵轴是每个笔画宽度值所对应的边缘像素点个数的归一化值,文本的笔画宽度值基本一致,因此,在坐标轴中的分布集中且尖锐,而非文本的笔画宽度值相差较大,在坐标轴中的分布均匀且平坦,计算出每个笔画宽度值所对应的边缘像素点个数归一化值的平均值E(Ns)和标准差STD(Ns),并计算出每个笔画宽度值所对应的边缘像素点个数归一化值的变化率C(Ns)=STD(Ns)/E(Ns),如果C(Ns)0.3,则判定为候选字符区域,将其进行保留,否则,判定为非字符区域,将其进行过滤,去除每个笔画宽度所对应的边缘像素点个数相差较大的那些区域,就可以排除掉背景中一些明显不可能是字符的区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711385007.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于背景先验的显著性检测方法
- 下一篇:一种火焰测温方法