[发明专利]复杂干扰下字符串的分割与识别方法无效

申请号：	201210193246.6	申请日：	2012-06-13
公开（公告）号：	CN102722736A	公开（公告）日：	2012-10-10
发明（设计）人：	汪荣贵;戴经成;周良;李想;游生福;查炜	申请（专利权）人：	合肥工业大学
主分类号：	G06K9/66	分类号：	G06K9/66;G06K9/34
代理公司：	安徽省合肥新安专利代理有限责任公司 34101	代理人：	何梅生
地址：	230009 ***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	复杂干扰字符串分割识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及图像处理领域，具体地说是一种复杂干扰下字符串的分割与识别技术。

背景技术

光学字符识别技术（Optical Character Recognition，简称OCR）经过多年的发展，取得了巨大的进步，目前已经在手写输入、车牌自动识别、文本的自动扫描与识别等领域得到广泛的应用。然而，现有的OCR技术还难以对复杂干扰下的字符串进行稳健的分割与识别。正因为如此，网络上通常采用受到一定干扰的字符串作为验证码，来鉴别某种操作是人工行为还是计算机的自动行为。

目前，对字符串的识别方法主要分为两大类，一种是基于欧式空间距离的方法，例如模板匹配，PCA,2D-PCA,Hu不变矩等；这类方法简单，易于实现，且对形状规整的字符具有较好的识别效果；但是对于复杂干扰下的字符串，识别效果很差。

复杂干扰下的字符串一般具有以下特征:

（1）它们每种类型的字符都有多种字体，且故意扭曲或旋转一定角度；

（2）字符粘连在一起，不易区分；

（3）干扰与字符本身的特征没有明显区别。

通过增加学习模板的方法，虽然在一定程度上提高了识别率，但是会过多的增加在时间上的开销。

另一种是基于有监督机器学习的识别方法，例如神经网络，SVM，AdaBoost算法等。这类方法具有机器学习的能力，能够自动统计出样本的特征，具有较高的识别率和较快的识别速度；但是这类方法需要非歧义的样本，对于有干扰的样本，不能取到很好的学习效果，所以对复杂干扰下的字符串的识别率较低。

对于无法用算法去除干扰的字符串，上述两种方法都需要人工去除干扰并制作大量样本。这样做是既费时又费力的。

发明内容

本发明是为避免上述现有技术所存在的不足之处，提出一种复杂干扰下字符串的分割与识别方法，能够实现样本的自动获取，在保证识别率的情况下不会增加时间上的开销，对于有干扰的样本，能取到很好的学习效果和识别率。

本发明解决技术问题采用如下技术方案：

本发明一种复杂干扰下字符串的分割与识别方法的特点是按如下过程进行：

Ⅰ、学习阶段：利用多示例机器学习的方法按如下步骤对复杂干扰下字符串进行学习；

步骤1、获取多示例学习的各个包；

将包含有干扰的m个字符图像切分成m份图片；每一份图片包含且仅包含一个完整的字符；将所述m份图片作为多示例学习的m个包，以所述m个包分别入库；所述分别入库是指将同一字符作为同一类，放入在同一个文件夹中，获得与类的数量相一致的n个文件夹，所述n不大于m；

步骤2、利用haar-like特征原型提取haar-like特征作为包的示例；

若所述图像不是灰度图像，则先将库内的每一个包进行灰度化处理，再按式(1)计算包的积分图；若所述图像是灰度图像，则利用式(1)计算包的积分图ii：

ii(x,y)=Σi≤x,j≤yimg(i,j)---(1)]]>

式(1)中ii(x,y)表示图像中横坐标i≤x，纵坐标j≤y的所有像素之和；

采用haar-like特征原型在所述包的积分图中提取haar-like特征作为包的示例；所述包的示例由向量表示，所述向量的每一个分量对应每一个haar-like特征原型所提取的特征值；

步骤3、利用多样性密度算法找到库中每一类的多样性密度最大的前u个包的示例作为该类的关键示例；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于合肥工业大学，未经合肥工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210193246.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]复杂干扰下字符串的分割与识别方法无效

专利文献下载