[发明专利]融合二值图像与灰度图像的字符识别的方法有效
申请号: | 200810239331.5 | 申请日: | 2008-12-10 |
公开(公告)号: | CN101751565A | 公开(公告)日: | 2010-06-23 |
发明(设计)人: | 张树武;杨武夷 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 梁爱荣 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 图像 灰度 字符 识别 方法 | ||
技术领域
本发明属于字符识别领域(简称OCR),涉及一致融合二值图像与灰 度图像的字符识别的方法。
背景技术
传统的字符识别技术是基于字符的二值图像或者是基于字符的灰度 图像。当基于字符的二值图像的识别技术应用于各种低质量图像,比如视 频中的退化字符图像、身份证图像、汽车牌照、自然场景中的字符图像等 低分辨率图像,由于二值化后的字符图像质量低,识别效果差。当基于字 符的灰度图像的识别技术应用于包含复杂背景的字符图像,比如视频中的 字符图像,由于字符图像包含非一致的背景,识别效果将变差。
发明内容
为了解决现有技术的问题,本发明的目的在于提供一种融合字符的二 值图像与灰度图像进行字符识别的方法。
为达成所述目的,本发明提供的融合二值图像与灰度图像的字符识别 的方法,对所述二值图像与灰度图像的融合图像进行处理,进行字符识别, 其包括以下步骤:
步骤1:设预处理后得到的单个字符图像的二值图像为B0=[b0(x,y)], 其中位于第x行第y列的像素点的值为b0(x,y),b0(x,y)为0或1,图像的 大小为W1×H1;字符的灰度图像为Gc=[gc(x,y)],位于第x行第y列的像素 点的值为gc(x,y),0≤gc(x,y)≤255;将字符图像的二值图像B0与灰度图像 Gc进行融合,得融合后的图像G=[g(x,y)],位于第x行第y列的像素点的 值为g(x,y),0≤g(x,y)≤255;
步骤2:在提取融合图像G=[g(x,y)]的特征前,先进行融合图像G=[g (x,y)]的位置和大小的归一化处理;图像归一化处理的输入图像为G=[g(x, y)],归一化后的输出图像为F=[f(x’,y’)],其大小分别为W1×H1和W2×H2; 输入图像G=[g(x,y)]位于第x行第y列的像素点将被映射到F=[f(x’,y’)] 位于第x’行第y’列的像素点,通过输入图像和输出图像的坐标映射来实现 图像归一化:
一维坐标映射为:
步骤3:基于梯度直方图提取归一化图像的梯度直方图的特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810239331.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:氟代烷基表面活性剂
- 下一篇:一种处理信号的方法和系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序