[发明专利]一种脱机手写体汉字识别方法无效
申请号: | 201210178849.9 | 申请日: | 2012-06-01 |
公开(公告)号: | CN102750556A | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 马丕明;张璇 | 申请(专利权)人: | 山东大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/60 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 许德山 |
地址: | 250100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种脱机手写体汉字识别方法,属汉字识别提取技术领域,步骤包括数据采集、预处理、特征提取和识别输出。本方法提供的汉字识别方法中的分类识别准则是根据最小距离准则对待测样本进行分类,特征识别基于4×4的弹性网格,粗分类识别将每个网格内特征点即端点、拐点、交叉点的个数统计出来,分别加权求和;二次分类识别将每个网格内横、竖、撇、捺四种笔画向量的个数统计出来,以识别提取出手写体汉字来。本发明方法既可以识别脱机手写体汉字,也可以识别印刷体;该汉字识别方法特征提取算方法简单,识别速度快。 | ||
搜索关键词: | 一种 脱机 手写体 汉字 识别 方法 | ||
【主权项】:
1.一种脱机手写体汉字识别方法,步骤如下:1)数据采集识别过程中所用到的手写体汉字图像数据预先由手写体设备手机、ipad书写,输入电脑中存储备用;2)预处理对于一副待识别的汉字图像进行预处理,包括平滑去噪、二值化、行字切分、图像归一化和细化;a.平滑去噪由于汉字噪声大部分是高斯加性白噪声,故此处选择高斯低通滤波器来完成汉字图像的平滑去噪处理;b.二值化二值化采用阈值法,对于灰度图像中每个像素的取值范围是0-255,设定阈值为0.5,则图像数据中像素值凡是超过255×0.5=127.5的都变为1,否则都变为0;c.行字切分对汉字图像先从左至右逐列扫描,将笔画像素值累加,获得竖直投影,后从上到下逐行扫描,同样将笔画像素值累加,获取图像的水平投影,利用汉字行列间空白间隔造成的水平和竖直投影空隙,将行、字分割,得到单个汉字;d.图像归一化对汉字进行归一化处理,消除汉字在位置和大小上的变化,先判断汉字点阵的上、下、左、右的外围边框,然后利用双线性内插法将汉字线性放大或缩小成64×64大小的点阵,以备后续处理;e.细化采用5×5大小的像素模板,对各像素自左至右、从上到下分别标记像素为:P1,P2,…,P25,其中P13是位于中心的像素点的像素,对于P13=1,如果同时满足下面四个条件,则删除P13,即P13=0,①2≤N(P13)≤6,其中N(P13)是P13周围非零邻点的个数;②Z0(P13)=1,其中Z0(P13)是以P13周围P7,P8,P9,P14…,P12逆时针为序时这些像素点的值从0到1变化的次数;③P8*P12*P14=0或者Z0(P8)≠1,其中Z0(P8)是以P8周围P2,P3,P4,P9,…,P7逆时针为序时这些像素点的值从0到1变化的次数;④P8*P12*P18=0或者Z0(P12)≠1,其中Z0(P12)是以P12周围P6,P7,P8,P13,…,P11逆时针为序时这些像素点的值从0到1变化的次数;3)特征提取特征提取包括弹性网格的划分、粗分类特征提取及二次分类特征提取,整个提取过程均是基于弹性网格;ⅰ.弹性网格的划分对一个汉字二值图像进行纵横网格划分,根据其笔画分布,使得纵横网格内包含汉字的黑像素数量相等,这种划分方法形成的网格就是非均匀的,称为弹性网格;令f(x,y)=1,当(x,y)为笔画像素时,背景像素为1;假设网格的大小为m×n,i,…m+1和就j,…n+1分别为水平和垂直网线的位置坐标,则对任意的i,j属于1到m,s、t属于1到n,弹性网格的划分应该满足:∫ i i + 1 ∫ 1 n + 1 f ( x , y ) dxdy = ∫ j j + 1 ∫ 1 n + 1 f ( x , y ) dxdy - - - ( 1 ) ]]>∫ s s + 1 ∫ 1 m + 1 f ( x , y ) dydx = ∫ t t + 1 ∫ 1 m + 1 f ( x , y ) dydx - - - ( 2 ) ]]> 其中f(x,y)表示汉字二值图像,
在识别过程中选用了4×4的弹性网格划分方法;ⅱ.粗分类特征提取特征点也就是端点、拐点、分叉点的提取,对每个小网格内三类点的个数进行加权求和,求出4×4个数据作为特征向量,所设计的权值为:拐点为1,交叉点为2,端点为4,由于拐点容易识别错误所以设置了最小权值;(1)分叉点的提取定义“像素点的度”:将点P的八个邻域点左上、上、右上、右、右下、下、左下、左分别记作x0、x1、x2、x3、x4、x5、x6、x7,设汉字的笔画(即黑色像素点)的像素值为1,非汉字像素点(即背景)的像素值为0,由以下公式计算得到像素点的度count(P),count ( P ) = 1 2 Σ i = 0 7 ( x i + 1 - x i ) 2 - - - ( 3 ) ]]> 在公式中为了计算方便,假设x8=x0;利用count(P)的值可以判断出P点是端点还是分叉点,如果count(P)<2,那么P点就是端点,当count(P)>2时,P点为汉字的分叉点,介于端点和分叉点的中间点的count(P)=2;(2)笔段拐点的提取取汉字一个笔段上的任意一个像素点P,并连接此笔段的两个端点P1和P2做直线L,以P1P2为直径,以P1P2中点O为圆心作圆,过像素点P的半径与圆的交点记为M,M到P1P2所在直线的距离记为D;随着像素点P的移动,D取值是动态的;记点P到P1P2所在直线的距离为D(P),取Dthd=D/2,对于笔段上所有的点P,选取D(P)>Dthd的点,即为该笔段的拐点;为了防止将笔画拆分的过于松散,采取了两次拐点法,即对一个汉字,最多取两次拐点;ⅲ.最终识别特征提取根据汉字笔画结构上具有横、竖、撇、捺四个方向的特点,将子块内的笔画按象素分解成四个方向分量,考虑子块内某一黑象素的八个邻域,按如下方法确定四个方向分量:(1)横分量fH(x,y):P1或P5为黑象素;(2)竖分量fV(x,y):P3或P7为黑象素;(3)撇分量fL(x,y):P2或P6为黑象素;(4)捺分量fR(x,y):P4或P8为黑象素;将每个子块的四个方向分量分别用DH,DV,DL,DR表示,这四个方向分量组成一个子块的特征向量,第i个子块内的四个方向分量的统计值可分别定义为下式:D H ′ = ∫ ∫ B ′ f H ( x , y ) dxdy ∫ ∫ B ′ f ( x , y ) dxdy - - - ( 7.1 ) ]]>D V ′ = ∫ ∫ B ′ f V ( x , y ) dxdy ∫ ∫ B ′ f ( x , y ) dxdy - - - ( 7 . 2 ) ]]>D L ′ = ∫ ∫ B ′ f L ( x , y ) dxdy ∫ ∫ B ′ f ( x , y ) dxdy - - - ( 7 . 3 ) ]]>D R ′ = ∫ ∫ B ′ f R ( x , y ) dxdy ∫ ∫ B ′ f ( x , y ) dxdy - - - ( 7 . 4 ) ]]> 4)识别输出在进行汉字的特征提取之后,采用最小距离准则进行模板匹配,以对脱机手写体汉字进行识别,汉字识别确定后直接输出至液晶显示屏。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210178849.9/,转载请声明来源钻瓜专利网。
- 上一篇:光齿段内啮合盘式座椅调角器核心装置
- 下一篇:灯具