[发明专利]计算机鉴别手写汉字的方法无效
申请号: | 201110169749.5 | 申请日: | 2011-06-22 |
公开(公告)号: | CN102254196A | 公开(公告)日: | 2011-11-23 |
发明(设计)人: | 殷绪成 | 申请(专利权)人: | 江苏奥博洋信息技术有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/66 |
代理公司: | 镇江京科专利商标代理有限公司 32107 | 代理人: | 夏哲华 |
地址: | 212009 江苏省镇江市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机 鉴别 手写 汉字 方法 | ||
技术领域
本发明涉及一种基于集成学习算法Bagging和单类SVM的计算机鉴别手写汉字的方法,属于计算机图像处理和字符识别技术领域。
背景技术
随着中国经济的快速发展,越来越多的外国人热衷到中国,汉语逐渐成为热门语言。然而,如何写汉字成为重要而又困难的事情。随着计算机及网络的发展与普及,很多对外汉语专业的教师希望能通过文档扫描的方式,利用模式识别技术来自动评估和指导外国学生的汉字书写。现有多种手写字符分类和识别技术。对于手写字符鉴别,目前大部分技术专注于在线手写字符鉴别和签名验证。这些手写字符鉴别和验证技术根据特征提取方法可以分为两大类:基于变形的方法和基于结构的方法。
但关注一般意义上的手写字符鉴别的研究较少,其原因主要包括:手写字符鉴别本身是个很困难的任务;手写字符鉴别需要很多细节而琐碎的技术,比如要处理许多非常相似的结构、笔画和书写风格等;另外,一般意义上的手写字符识别总是要应对大类别数的问题,尤其是汉字。因此手写汉字鉴别面临巨大挑战。
发明内容
本发明所要解决的技术问题是,提供一种可对手写汉字进行自动评估和指导、汉字识别准确率高的计算机鉴别手写汉字的方法。
本发明计算机鉴别手写汉字的方法包括以下步骤:
a,将手写汉字样本正规化处理大小为64*64;
b.提取手写汉字样本的加权方向码直方图WDCH特征;
加权方向码直方图特征利用了图像中的所有像素点的信息,而且将各个点的方向属性量化到16级,大大增加特征提取的精度。其特征提取算法的步骤如下:
①对正规化的64*64的字符图像做n次3×3均值滤波,并将得到的灰度图像的灰度值归一化到[-1,1],均值为0;
②用Sobel算子对归一化后的灰度图像提取梯度,并计算每一点的梯度强度,公式如下:
dx=[f(x-1,y-1)+2f(x,y-1)+f(x+1,y-1)]-[f(x-1,y+1)+2f(x,y+1)+f(x+1,y+1)]
(1)
dy=[f(x+1,y-1)+2f(x+1,y)+f(x+1,y+1)]-[f(x-1,y-1)+2f(x-1,y)+f(x-1,y+1)]
(2)
其中,θ(x,y)和S(x,y)就是点(x,y)的梯度方向和强度;
③将梯度方向量化到32级,间隔为π/16;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏奥博洋信息技术有限公司,未经江苏奥博洋信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110169749.5/2.html,转载请声明来源钻瓜专利网。