[发明专利]一种手写数字的识别方法在审
申请号: | 201810477145.9 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108734168A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 梁倩;杜程 | 申请(专利权)人: | 天津科技大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/40;G06K9/44;G06K9/62;G06N3/04 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王利文 |
地址: | 300222 天津市河*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数字图像 图像 预处理 训练集样本 参数训练 手写数字 网络模型 测试集 样本 卷积神经网络 神经网络参数 神经网络模型 手写数字识别 归一化处理 字符串分割 大小不一 降低噪声 细化处理 信函分拣 银行支票 二值化 复杂度 灰度化 识别率 准确率 录入 网络 邮局 配置 图片 | ||
本发明涉及一种手写数字的识别方法,包括如下步骤:对数字图像进行预处理,包括灰度化数字图像、二值化数字图像、图像除噪处理、字符串分割处理、数字归一化处理和数字细化处理步骤;搭建深度卷积分神经网络模型、配置神经网络参数、生成训练集样本与测试集样本、调参数训练网络并通过训练好的网络模型识别数字。本发明通过对图像进行预处理不仅能显著地降低噪声对图像的影响,而且还将大小不一的图像归一化为同一尺寸的图片,通过深度卷积神经网络,生成训练集样本与测试集样本,调参数训练网络,通过训练好的网络模型识别数字,能够在复杂度相似的情况下提高手写数字识别的准确率和识别率,可广泛用于邮局信函分拣、银行支票录入等领域。
技术领域
本发明属于光学识别技术领域,尤其是一种手写数字的识别方法。
背景技术
识别手写数字的技术是识别光学字符的其中一个分支,该技术能够借助机器或者电脑智能识别各种文本上的数字。由于各国都会用同一种数字,而且目前人们对信息化的需求越来越大,所以手写数字的识别在邮局信函分拣、银行支票录入等大规模数据分析系统中的应用前景是非常广阔的。
目前识别手写数字主要有两种,一种是通过其构造的特点进行识别,另外一种是基于统计特征的识别。世界各国在这个方向上的研究都取得很大成果,例如,为了满足邮件分拣工作的需求,邮电部第三研究所采用识别邮票上邮编的方法去对信函进行分类。上海的交大用的识别算法是基于压缩字结构特征的方法,他们训练时使用了12600个数据,测试用了6000个数据,依靠BP(back propagation)神经网络作为识别工具,准确率达97.58%,1.38%无法识别。德国Friedhelm Schwenker识别数字的方法是用SV-RBF40,其中包括10000个测试数据集,识别结果达到98.56%的准确率。但是以上识别方法,或者对书写有规范的要求,或者其使用的测试与训练的数字库都是出一人手里的,这些问题都对书写人有较多的限制。如何实现无限制的识别手写数字是目前迫切需要解决的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种手写数字的识别方法,能够在复杂度相似的情况下提高手写数字识别的准确率和识别率。
本发明解决其技术问题是采取以下技术方案实现的:
一种手写数字的识别方法,包括以下步骤:
步骤1、对数字图像进行预处理,包括灰度化数字图像、二值化数字图像、图像除噪处理、字符串分割处理、数字归一化处理和数字细化处理步骤;
步骤2、搭建深度卷积分神经网络模型、配置神经网络参数、生成训练集样本与测试集样本、调参数训练网络并通过训练好的网络模型识别数字。
进一步,所述灰度化数字图像采用YUV方法,将数字图像转换成灰度图。
进一步,所述二值化数字图像通过二值化处理算法大津法和不均匀光照补偿方法对灰度化数字图像进行处理,得到光照补偿后的二值图。
进一步,所述图像除噪处理采用Unger平滑滤波方法。
进一步,所述字符串分割处理采用垂直与平行投影法:首先对字符串进行水平投影,然后对映射的特征轴进行切割,把轴看成一幅有波峰与波谷的图,波谷的位置就是切割点,最后再进行垂直投影,将成一行的数字字符串切成单个字符。
进一步,所述数字归一化处理采用双线性插值法:首先将图像放入x,y坐标系内,然后对x轴方向做两次线性插值,最后对y轴方向做一次线性插值。
进一步,所述数字细化处理采用经典的zhang并行快速细化算法进行数字的细化处理。
进一步,所述神经网络模型采取卷积层、池化层、卷积层、池化层、全连接层、全连接层及输出层结构,采用mnist数据集,其中包含的都是大小为28×28的图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学,未经天津科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810477145.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序