[发明专利]复杂干扰下字符串的分割与识别方法无效
申请号: | 201210193246.6 | 申请日: | 2012-06-13 |
公开(公告)号: | CN102722736A | 公开(公告)日: | 2012-10-10 |
发明(设计)人: | 汪荣贵;戴经成;周良;李想;游生福;查炜 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06K9/34 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 何梅生 |
地址: | 230009 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 干扰 字符串 分割 识别 方法 | ||
1.一种复杂干扰下字符串的分割与识别方法,其特征按如下过程进行:
Ⅰ、学习阶段:利用多示例机器学习的方法按如下步骤对复杂干扰下字符串进行学习;
步骤1、获取多示例学习的各个包;
将包含有干扰的m个字符图像切分成m份图片;每一份图片包含且仅包含一个完整的字符;将所述m份图片作为多示例学习的m个包,以所述m个包分别入库;所述分别入库是指将同一字符作为同一类,放入在同一个文件夹中,获得与类的数量相一致的n个文件夹,所述n不大于m;
步骤2、利用haar-like特征原型提取haar-like特征作为包的示例;
若所述图像不是灰度图像,则先将库内的每一个包进行灰度化处理,再按式(1)计算包的积分图;若所述图像是灰度图像,则利用式(1)计算包的积分图ii:
式(1)中ii(x,y)表示图像中横坐标i≤x,纵坐标j≤y的所有像素之和;
采用haar-like特征原型在所述包的积分图中提取haar-like特征作为包的示例;所述包的示例由向量表示,所述向量的每一个分量对应每一个haar-like特征原型所提取的特征值;
步骤3、利用多样性密度算法找到库中每一类的多样性密度最大的前u个包的示例作为该类的关键示例;
步骤4、将每一类的关键示例作为SVM分类器样本进行分类;按照类的个数n训练出n个SVM分类器,将所述n个SVM分类器构造成一棵二叉决策树,每个SVM分类器为所述二叉决策树的每个节点;所述每个SVM分类器按如下方法获得;
将库中某一类的关键示例作为SVM分类器学习的正样本:从库中其它类中的所有关键示例中任意选取u个关键示例,作为SVM分类器学习的负样本:以所述正样本和负样本通过SVM算法训练得到式(7)所表征的SVM分类器f(t):
f(t)=sgn(<W*,t>+b*) (2)
式(2)中,b*为设定的阈值,t为待分类的学习样本,W*为权重向量;
Ⅱ、识别阶段:利用所述多示例机器学习方法获得的SVM分类器f(t)对复杂干扰下字符串进行识别;
以最小的字符大小作为初始扫描矩形特征窗口,自左至右、再自上而下,扫描图像经切分后的每个图片;计算扫描窗口内的矩形特征值,得到特征向量T,将所述特征向量T从所述二叉决策树顶端按照从上到下的顺序代入每个节点,利用式(3)计算获得f(T):
f(T)=sgn(<W*,T>+b*) (3)
直到f(T)大于0时,分类结束,输出识别结果;若特征向量T带入所述二叉决策树的最后一个节点计算后,f(T)仍小于0,则将所述初始扫描矩形特征窗口以固定倍率扩大后,再带入所述二叉决策树顶端的每个节点进行计算,直至f(T)>0,则分类结束,输出识别结果,若所述初始扫描矩形特征窗口的大小扩大到大于最大字符时,仍然未找到f(T)>0,则表示识别失败。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210193246.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体电容器的形成方法
- 下一篇:带驱动突缘的切割带