[发明专利]一种基于自学习色彩聚类的自然场景文本检测的方法有效
申请号: | 201710021572.1 | 申请日: | 2017-01-12 |
公开(公告)号: | CN106874905B | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 郭建京;邹北骥;吴慧;杨文君;徐子雯 | 申请(专利权)人: | 中南大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 龚燕妮 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自学习 色彩 自然 场景 文本 检测 方法 | ||
本发明提供了一种基于自学习色彩聚类的自然场景文本检测的方法,首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符,该自适应色彩聚类方法能针对不同图像自动学习权重阈值,有较好的字符召回率。然后,通过训练Adaboost分类器,构建字符验证模型,移除非文本字符;最后,合并字符构建文本行,并通过后处理得到文本检测结果。与传统的方法相比,本方法能获得较高的文本检测召回率,且检测的文本结果较为准确。
技术领域
本发明属于模式识别技术领域,涉及一种基于自学习色彩聚类的自然场景文本检测方法。
背景技术
自然场景图像文本包含大量有效信息,提取图像文本是图像内容分析和理解的重要前提,并可广泛应用于车牌检测、无人驾驶、基于内容的图像检索、手机文本识别和机器人自动导航等领域。然而,由于自然场景图像文本检测方法受到多方面的因素影响,增加了文本检测的难度,其中影响因素主要分为以下三类:
复杂的图像背景:图像采集于任意的场景,不同图像中色彩复杂程度各异,且存在大量的树叶、砖头、栏杆和瓦片等干扰物体,易导致文本检测错误。
多样化的文本:自然场景图像中文本尺寸大小和样式的多样化,且文本字符存在不同程度的扭曲和倾斜。
不同程度的干扰因素:自然场景图像为户外拍摄采集得到,易受不同程度的光照、阴影、分辨率和拍摄角度的影响。
为克服上述影响因素,提高文本检测的准确率,专家学者提出了大量的自然场景文本检测方法,主要分为两类:基于滑动窗口的方法和基于连通域的方法。
基于滑动窗口的文本检测方法通常使用多尺度滑动窗口,扫描原始图像,提取候选文本区域,然后结合候选区域色彩、梯度和纹理等特征,利用机器学习的方法进行验证,得到文本检测结果。由于图像中文本尺寸的多样性,基于滑动窗口的方法通常使用多尺度窗口扫描图像,提取候选文本,使得该方法耗时长,产生的候选区域过多,增大了后续文本验证的难度。
基于连通域的方法是目前较为流行的文本检测方法。该方法进一步分为三个子任务:(1) 候选字符提取,(2)候选字符验证,(3)文本区域分析。
候选字符提取通常考虑图像中文本字符包含的像素点具有灰度一致性、色彩一致性、笔画宽度均一性等特征,进而提取特征相似的像素点,构建候选字符连通域。
候选字符验证通常通过对字符和背景区域进行分析,提取一系列易于区分背景和文本的特征,并结合机器学习的方法验证候选字符连通域,移除非文本字符。
文本区域分析通常是对验证后保留的字符进行后处理操作。一般,通过分析字符连通域的空间位置,色彩、纹理等特征,将位置、色彩和纹理相近的字符进行合并,构成文本行,然后使用启发式规则和机器学习的方式对文本行进行分词和验证,得到最终的检测结果。
由于自然场景图像背景复杂多变,图像中文本色彩、字体、尺寸等多样化,且受到不同程度的光照、阴影、拍摄角度的影响。因此,如何从不同复杂程度的背景中有效提取提取候选字符,是基于连通区域文本检测方法的关键。
发明内容
本发明提供了一种基于自学习色彩聚类的文本检测方法,为了克服上述现有文本检测方法存在的问题,本方法将层次聚类和参数自学习策略相结合,实现自适应色彩聚类算法,构建色彩层,提取色彩层中的连通区域,作为候选字符,进而定位图像中的文本。
一种基于自学习色彩聚类的自然场景文本检测方法,包括以下步骤:
步骤1:将待进行文本检测图像I中的每个像素点的R、G、B色彩值投影到三维色彩空间中,对三维色彩空间进行等间距划分,每个三维色彩空间立方体作为一个层次聚类基本单元;
以每个三维色彩空间立方体中所有像素点的色彩均值作为层次聚类基本单元的特征c;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710021572.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车牌图片矫正方法及装置
- 下一篇:一种图片的二值化方法、装置及终端