[发明专利]复杂干扰下字符串的分割与识别方法无效

申请号：	201210193246.6	申请日：	2012-06-13
公开（公告）号：	CN102722736A	公开（公告）日：	2012-10-10
发明（设计）人：	汪荣贵;戴经成;周良;李想;游生福;查炜	申请（专利权）人：	合肥工业大学
主分类号：	G06K9/66	分类号：	G06K9/66;G06K9/34
代理公司：	安徽省合肥新安专利代理有限责任公司 34101	代理人：	何梅生
地址：	230009 ***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	复杂干扰字符串分割识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种复杂干扰下字符串的分割与识别方法，其特征按如下过程进行：

Ⅰ、学习阶段：利用多示例机器学习的方法按如下步骤对复杂干扰下字符串进行学习；

步骤1、获取多示例学习的各个包；

将包含有干扰的m个字符图像切分成m份图片；每一份图片包含且仅包含一个完整的字符；将所述m份图片作为多示例学习的m个包，以所述m个包分别入库；所述分别入库是指将同一字符作为同一类，放入在同一个文件夹中，获得与类的数量相一致的n个文件夹，所述n不大于m；

步骤2、利用haar-like特征原型提取haar-like特征作为包的示例；

若所述图像不是灰度图像，则先将库内的每一个包进行灰度化处理，再按式(1)计算包的积分图；若所述图像是灰度图像，则利用式(1)计算包的积分图ii：

ii(x,y)=Σi≤x,j≤yimg(i,j)---(1)]]>

式(1)中ii(x,y)表示图像中横坐标i≤x，纵坐标j≤y的所有像素之和；

采用haar-like特征原型在所述包的积分图中提取haar-like特征作为包的示例；所述包的示例由向量表示，所述向量的每一个分量对应每一个haar-like特征原型所提取的特征值；

步骤3、利用多样性密度算法找到库中每一类的多样性密度最大的前u个包的示例作为该类的关键示例；

步骤4、将每一类的关键示例作为SVM分类器样本进行分类；按照类的个数n训练出n个SVM分类器，将所述n个SVM分类器构造成一棵二叉决策树，每个SVM分类器为所述二叉决策树的每个节点；所述每个SVM分类器按如下方法获得；

将库中某一类的关键示例作为SVM分类器学习的正样本：从库中其它类中的所有关键示例中任意选取u个关键示例，作为SVM分类器学习的负样本：以所述正样本和负样本通过SVM算法训练得到式(7)所表征的SVM分类器f(t)：

f(t)=sgn(<W^*,t>+b^*) （2）

式(2)中，b^*为设定的阈值，t为待分类的学习样本，W^*为权重向量；

Ⅱ、识别阶段：利用所述多示例机器学习方法获得的SVM分类器f(t)对复杂干扰下字符串进行识别；

以最小的字符大小作为初始扫描矩形特征窗口，自左至右、再自上而下，扫描图像经切分后的每个图片；计算扫描窗口内的矩形特征值，得到特征向量T，将所述特征向量T从所述二叉决策树顶端按照从上到下的顺序代入每个节点，利用式(3)计算获得f(T)：

f(T)=sgn(<W^*,T>+b^*) （3）

直到f(T)大于0时，分类结束，输出识别结果；若特征向量T带入所述二叉决策树的最后一个节点计算后，f(T)仍小于0，则将所述初始扫描矩形特征窗口以固定倍率扩大后，再带入所述二叉决策树顶端的每个节点进行计算，直至f(T)>0，则分类结束，输出识别结果，若所述初始扫描矩形特征窗口的大小扩大到大于最大字符时，仍然未找到f(T)>0，则表示识别失败。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于合肥工业大学，未经合肥工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210193246.6/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]复杂干扰下字符串的分割与识别方法无效

专利文献下载