[发明专利]一种基于边界点笔画形状的字符特征提取方法及应用无效
申请号: | 201210063621.5 | 申请日: | 2012-03-12 |
公开(公告)号: | CN102629322A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 汪国有;朱曼瑜;吴红岩;陈明华 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李佑宏 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 边界 笔画 形状 字符 特征 提取 方法 应用 | ||
技术领域
本发明属于图像处理中的字符检测识别领域,具体涉及一种字符特征提取方法及其在字符识别中的应用,可提高字符识别的速度和识别准确性,适于印刷字体中数字和字母的识别。
背景技术
印刷体字符(数字、字母)识别在很多领域都有很重要的应用,例如:车牌识别、钞票数字识别、邮政编码识别、工业元器件编号识别等。因此,印刷体字符识别越来越受到人们的关注。其中,印刷体字符特征提取直接关系到分类器的分类精度,特征选取的好坏直接影响到字符识别的速度和准确率。
字符特征提取就是对原始的字符图像数据进行变换,通过变换将原始图像数据模式变为变换空间中的数据模式。特征提取必须遵循以下三个原则:一、最能反映模式分类的可分性;二、特征维数尽可能的少;三、特征提取方法应该尽可能的简单。
字符特征的提取方法有很多,根据特征生成的方式主要分成两大类:1、基于图像统计量的特征提取方法;2、基于字符结构的特征提取方法。
字符统计量特征是指根据字符统计规律分析提取的特征,如字符黑像素密度、傅里叶变换、小波变换、Zernike矩和主成分分析等统计量。基于统计的方法能克服一定的字符平移、尺度、旋转变换带来的字符变型,具有良好的鲁棒性,较好的干扰能力,但是统计方法对于相似字符的识别性能较差。
结构特征指对字符的结构分析提取的反映字符结构的特征。一般该类方法需要先抽取笔段或基本笔画作为基元,由这些基元再构成部件,由部件的组合来描述字符,最后再进行文法推断、识别字符。例如,根据先验知识得知,由于数字和字母的结构都比较简单,基本都是由“横”、“竖”、“圈”、“弧”组成。对于待识别字符,分析字符中的笔画“横”、“竖”、“圈”、“弧”的数量、位置,以及字符区域内笔画分布的位置,即可判断识别结果。如,字符“E”可在字符区域的上方、中间、下方检测出“横”,在左边区域检测出“竖”;字符“A”则可在字符外接矩形的左上、右上方检测出空白区域;字符“6”则是由字符外接矩形下半部分的“圈”和上半部分的“弧”构成。该类方法的优点在于:计算量少,识别速度快,准确率高,对于相似字符识别也能取得较好的效果。这种方法的缺点在于结构特征所要抽取的笔段极易受到噪声、笔画的粘连或断裂的影响,对字符平移变换、尺度变换、旋转变换较敏感,鲁棒性差。所以,该类特征提取方法仅适用于拍摄环境好、字符噪声较少的情况。
综上所述,统计与结构方法各有优缺点。统计方法具有良好的鲁棒性,较好的抗干扰的能力,其统计平均把局部噪声和微小畸变淹没在最后的累加和里。但是,可以用来区分“敏感部位”的差异也随失,因此,区分相似字的能力较差。结构方法对结构特征较敏感,区分相似字的能力较强,但是结构特征难以抽取,不稳定;对噪声敏感,鲁棒性差。
发明内容
本发明旨在提出一种基于边界点笔画形状特征的字符提取方法,该方法结合了字符的结构分布特征和笔画形状特征,既能反映字符的结构特征,提高字符识别的精确度,又能利用统计法来去除局部噪声,鲁棒性好、识别准确率高。
本发明提出的基于边界点笔画形状的印刷体字符特征提取方法,具体步骤如下:
(一)字符图像的预处理,获得每个字符的正方形字符图像;
(二)对每个字符图像,按如下过程提取字符边界点的笔画形状特征:
(1)定义边界点的笔画形状特征,具体为:
定义边界点为扫描线上从背景色跳变为前景色时字符所对应的像素点。对任一边界点P,计算其在方向i上连续字符色像素点数在相应的像素集中所占的比重di,其中di=li/Sp,i,方向i指以点P为原点作直角坐标系,沿两坐标轴所在直线及沿平分四个象限的两条直线的方向中的任一方向,i=1,2,3或4,li表示i方向上连续字符色像素点的个数,Sp,i表示为过点P作一条沿方向i的直线,落在该直线上的像素点数,di=[d1,d2,d3,d4]构成的向量即为该边界点P的4维笔画形状特征;
(2)沿水平方向和垂直方向分别将单元字符图像平均分为5个水平区域和5个垂直区域;
(3)对各个水平区域在水平方向上进行逐行扫描,获得各水平区域的边界点的4维笔画形状特征;
(4)对各个垂直区域在垂直方向上进行逐列扫描,获得各垂直区域的边界点笔画形状特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210063621.5/2.html,转载请声明来源钻瓜专利网。