[发明专利]一种基于分类模糊及图像分割的英文字符识别方法有效
申请号: | 201310376411.6 | 申请日: | 2013-08-27 |
公开(公告)号: | CN103455823B | 公开(公告)日: | 2016-10-12 |
发明(设计)人: | 李宏亮;黄敏;姚卫;黄自力;孟凡满;黄超;吴庆波 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 邹裕蓉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分类 模糊 图像 分割 英文 字符 识别 方法 | ||
1.一种基于分类模糊及图像分割的英文字符识别方法,其特征在于,包括以下步骤:
第1步:利用输入的含有一行或一列待识别英文字符串的图像生成二值掩模,属于字母的像素点的掩模值为1,属于背景的像素点的掩模值为0;
第2步:使用滑动窗对图像取大小不同的子窗口;对于英文字母水平排列的英文字符串,子窗口的行数为输入待识别字符串总行数,子窗口的行数逐渐增长,子窗口的列的起点位置逐渐向右移动;对于英文字母垂直排列的英文字符串,子窗口的列数为输入待识别字符串总列数,子窗口的行数逐渐增长,子窗口的行的起点位置逐渐向下移动;
第3步:各根据子窗口二值掩模计算子窗口的分离置信度SC:其中,ω为权值,对于英文字母水平排列的英文字符串,no为子窗口最后一列对应的掩模值为1的像素总数,n为子窗口最后一列上像素总数量;对于英文字母垂直排列的英文字符串,no为子窗口最后一行对应的掩模值为1的像素总数,n为子窗口最后一行上像素总数量;
第4步:对子窗口提取特征并使用字母分类器分类,字母分类器输出子窗口对应的分类结果和分类分数;所述字母分类器类别包括普通字母类别与模糊字母类别,所述普通字母类别仅包括一个大写字母、小写字母或者数字类别;所述每一个模糊字母类别包括1类的形状相似的大写字母类别以及小写字母类别,或者,1类形状相似的大写字母类别、小写字母类别以及数字类别;
第5步:计算每个子窗口得分,子窗口得分为子窗口对应的分离置信度与分类分数之积;
第6步:将所有已输出分类结果的子窗口以字母排列方向链接成多条单向路径,两个子窗口链接条件为:一个子窗口在字母排列方向上的结束点与另一个子窗口在字母排列方向上的起点位置偏移在预设最小范围内。
第7步:计算各单向路径的路径分数,通过对该单向路径对应的所有链接子窗口的子窗口得分进行乘积,再对乘积结果开n次方,n为该单向路径对应的所有链接子窗口总数,开方结果为该单向路径的路径分数;
第8步:将路径分数最高的单向路径作为结果路径输出;
第9步:判断结果路径的子窗口分类情况,是否存在模糊类,如否,则直接依次输出结果路径上子窗口对应的识别字符串;如是,则根据模糊类子窗口对应的2个或2个以上可能分类结果,依次输出结果路径上子窗口对应的可能的字符串组合,再根据常用英文字母组合规则选出最合理的作为最终的识别字符串。
2.如权利要求1所述一种基于分类模糊及图像分割的英文字符识别方法,其特征在于,所述字母分类器包括50个字母分类类别,其中10个模糊字母类别以及40个普通字母类别;
所述10个模糊字母类别分别为:
大写字母O、小写字母o以及数字0;
大写字母C以及小写字母c;
大写字母I、小写字母l以及数字1;
大写字母P、小写字母p;
大写字母K、小写字母k;
大写字母S、小写字母s;
大写字母V、小写字母v;
大写字母W、小写字母w;
大写字母X、小写字母x;
大写字母Z、小写字母z。
3.如权利要求1所述一种基于分类模糊及图像分割的英文字符识别方法,其特征在于,第1步中利用输入的含有一行或一列待识别英文字符串的图像生成二值掩模后,将对二值掩模进行不规则噪声处理;
所述不规则噪声处理的实现方法为:对二值掩模进行联通区域编号,将包含像素点少于图像总像素点1%的联通区域中所有像素点置0。
4.如权利要求1所述一种基于分类模糊及图像分割的英文字符识别方法,其特征在于,所述起点位置偏移的预设最小范围为±2个像素。
5.如权利要求1所述一种基于分类模糊及图像分割的英文字符识别方法,其特征在于,所述常用英文字母组合规则包括:字符串可以全为大写字母;字符串可以全为小写字母;字符串可以首字母大写;当存在数字,数字可以存在字符串开端或结尾,不能存在于字符串中间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310376411.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序