[发明专利]基于连通分量和支持向量机的图像文本定位方法和装置有效
申请号: | 200710064388.1 | 申请日: | 2007-03-14 |
公开(公告)号: | CN101266654A | 公开(公告)日: | 2008-09-17 |
发明(设计)人: | 姚金良;杨一平;台宪青;薛文芳 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/72 | 分类号: | G06K9/72 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 周国城 |
地址: | 100080北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开基于连通分量和支持向量机的图像中文本定位的方法和装置,图像分割单元,连通域分析单元;连通分量特征获取和阈值确认单元,支持向量机分类单元,连通分量组合成文本区域单元,文本区域统计特征获取并确认单元;方法将输入图像分割得到图像分层结果,用连通域分析对前景层进行分析得到连通分量的集合;提取出连通分量特征,通过使用级联阈值分类器的结构排除大量的非字符连通分量,对剩下的候选字符连通分量再运用支持向量机分类方法进行识别是否是字符连通分量;对剩余的连通分量根据特征一致和距离相近原则组合成候选文本区域,并提取出这些候选文本区域的特征,对这些特征用经验性的阈值确认是否为文本区域。 | ||
搜索关键词: | 基于 连通 分量 支持 向量 图像 文本 定位 方法 装置 | ||
【主权项】:
1. 一种基于连通分量和支持向量机的图像文本定位置方法,其特征在于,步骤如下:步骤S1:将需要定位的图像根据其灰度值信息进行图像的分割处理,获得图像分层结果;步骤S2:对分割后的每一层作为前景进行连通域分析,得到候选字符连通分量集合;步骤S3:提取候选字符连通分量的特征,并用一个级联阈值分类器的结构排除非字符连通分量;每个阈值分类器的阈值通过统计样本数据获得;步骤S4:对使用级联阈值分类器未被排除的候选字符连通分量,采用基于支持向量机的分类方法进行是否是字符连通分量的分类,支持向量机的特征向量为上述获取的所有字符连通分量特征;步骤S5:将支持向量机分类结果中为字符的连通分量,根据其在图像中的位置关系和特征一致性进行组合,得到候选字符连通分量集合中的各个子集,包括子集中所有连通分量的最小矩形框称为该子集对应的文本区域,同时该子集称为文本区域中连通分量集合;步骤S6:计算文本区域中连通分量集合中连通分量特征的方差作为候选文本区域的特征,并使用经验性的阈值确认是否是文本区域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710064388.1/,转载请声明来源钻瓜专利网。