[发明专利]基于模糊分类器识别模糊图像中数字的方法有效

专利信息
申请号: 201310312407.3 申请日: 2013-07-24
公开(公告)号: CN103413152A 公开(公告)日: 2013-11-27
发明(设计)人: 成卫青;洪龙;杨庚;唐旋 申请(专利权)人: 南京邮电大学
主分类号: G06K9/66 分类号: G06K9/66;G06T5/00
代理公司: 南京知识律师事务所 32207 代理人: 汪旭东
地址: 210003 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明的特征:提供一种基于模糊分类器的离线数字识别方法,适用于识别质量降级图像中的数字,该方法从前景色象素的分布特征以及数字外形特征判别每个图像包含的字符是各个数字的真值程度,并能容忍图像少量的倾斜,再通过综合评判识别出图像中包含的数字,识别准确度较高;而且本发明能够基于少量训练样本的特征取值分布自动设定模糊分类器需要的参数,且多特征判别和自动设定参数使本发明具有较好的通用性;本发明有效解决了已有针对模糊图像的数字识别方法存在的准确度有待提高且需要大量训练样本的问题。
搜索关键词: 基于 模糊 分类 器识 图像 数字 方法
【主权项】:
一种针对模糊图像基于模糊分类器的离线数字识别方法,包括两部分内容:构建模糊分类器和对未知数字的模糊图像进行数字识别,步骤I.构建模糊分类器,包括特征选择和确定分类器所需的参数,具体步骤如下:步骤(1)首先对数字0~9分别选择若干相对规范的灰度图像作为训练样本,对每个已知数字的图像按照下列步骤计算特征:步骤(11)对灰度图像自适应二值化:找到出现频次最高的两个灰度值c1和c2,且确保c1与c2有一定的间隔;将所有灰度值接近c1的象素设为背景色1,其他的设为前景色0,得到单色图像;步骤(12)去除斑块:由于原始图像是模糊的,将经二值化后的单色图像中前景色象素数少于一定阈值的子图作为斑块去除,即将斑块设为背景色;步骤(13)切除边缘,使所有前景色象素在剩余的矩阵图像内,且通过增加边缘的方式确保图像不小于6行6列;步骤(14)计算所有特征:将图像分成3×3格子,每一格前景色象素数分别除以本行、本列、所有前景色象素数得到3个特征,9个格子得到27个特征m1~m27,另外计算特征m28和m29,它们定义为:m28=前景色高度/前景色宽度,m29=3×3格子中第一行格子的前景色象素数/所有前景色象素数;步骤(2)特征选择:利用logistic回归进行特征选择,将特征m1~m29作为自变量,将图像中的数字作为响应变量,将所有训练样本的m1~m27和样本表示的数字作为数据,认为有p小于0.05的特征回归系数极大似然估计具有统计意义,选择对应的特征;步骤(3)使用步骤(2)选择的特征,构建基于真值程度度量的分类器,真值程度函数中的参数按照下列步骤确定:步骤(31)将所有被选择特征的权重设为1,否则设为0;m28的类型为1,其余特征的类型为2;步骤(32)设置计算hT1‑28(m28(x))必须的4个参数,设置计算每个hTi‑k(mk(x)),i≠1且k≠28必须的2个参数,方法为:对于每个数字的每个特征,分别将所有训练样本的该特征值按照从小到大的顺序排列,令p0,p1,p2分别为列表的20th,50th,80th百分位数,p3=min(p2‑p1,p1‑p0);对于数字1的m28,设置距离比率函数的αT,εT,αF,εF分别为p1,p3,p1*0.4,p3*0.4;对于其他数字已被选择的特征,设置距离比率函数的αT,εT为p1,p3;步骤II.对未知数字的模糊图像的识别包括如下步骤:步骤(1)按照步骤I中步骤(11)~步骤(14)计算图像的特征;步骤(2)执行基本的离线识别过程,包括:步骤(21)按式(3)计算10个真值程度;如果gnT‑M‑1<0.1,保存该值,并将它设为‑∞;步骤(22)找到最大和第二大真值程度记为gnT‑M‑k1和gnT‑M‑k2;步骤(23)如果gnT‑M‑1为‑∞,将其恢复为保存的值;得到最可能和次可能的数字k1和k2,以及gnT‑M‑k1和gnT‑M‑k2四个值;步骤(3)设置d11,d12,truth11和truth12分别为上一步得到的4个值;步骤(4)如果(truth11>=LIMIT1or(truth11>=LIMIT3and truth11‑truth12>=LIMIT2)),其中LIMIT1,LIMIT2,LIMIT3为自定义阈值,则设置d1=d11,d2=d12,否则:步骤(41)先二值化原始图像,再将单色图像左转一定度数,然后执行步骤I.中步骤(12)~步骤(14)计算图像的特征;步骤(42)执行步骤(2),然后设置d21,d22,truth21和truth22分别为步骤(2)得到的4个值;步骤(43)如果(truth21>=LIMIT1or(truth21>=LIMIT3and truth21‑truth22>=LIMIT2)),则设置d1=d21,d2=d22,否则:将原始图像二值化,右转一定度数,计算图像的特征,执行步骤(2),然后设置d31,d32,truth31和truth32分别为步骤(2)得到的4个值,设置d1=di1,d2=di2,其中truthi1是truth11,truth21,和truth31的最大值;步骤(5)判断d1,d2分别为图像中最可能和第二可能的数字。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310312407.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top