[发明专利]基于卷积神经网络与支持向量机的手写数字识别方法在审
申请号: | 201611136985.6 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106599941A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 李阳阳;周林浩;焦李成;刘芳;尚荣华;马文萍;马晶晶;缑水平 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 陕西电子工业专利中心61205 | 代理人: | 程晓霞,王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 支持 向量 手写 数字 识别 方法 | ||
技术领域
本发明属于图像处理与模式识别中的技术领域,特别涉及手写数字的识别,具体是一种基于卷积神经网络与支持向量机的手写数字识别方法,在邮政、税务、交通、金融等行业的实践活动中有着极其广泛的应用。
背景技术
手写数字识别隶属于手写体字符识别的一个范畴,手写体识别又分为在线手写体识别和离线手写体识别。在线手写体识别通过记录文字图像抬笔、落笔、笔迹上各像素的空间位置,以及各笔段之间的时间关系等信息,对这些信息进行处理,在处理过程中,系统以一定的规则提取信息特性,再由识别模块将信息特征与识别库的特征进行比较,加以识别,最后转化为计算机所使用的文字代码。离线手写体识别相对于前者来说没有笔划信息,因此难度更大、应用更广泛,如银行票据、工商报表、财务报表、统计报表等各种表格系统,是目前研究的一个重点,也是一个难点,本发明属于离线手写体识别范畴。
随着信息网络的推广,有大量的数据要输入计算机网络。而且在现代信息社会,方方面面都要与数字打交道,数字与人们的日常生活息息相关。目前手写数字识别主要的应用有以下三个领域。
一、在邮件分拣中的应用
在邮件的自动分拣中,离线手写数字识别往往与人工辅助识别等手段相结合,完成邮政编码的阅读;然而在一些大中型城市,每天要处理的邮件量高达几百万件,业务量的急剧上升使得邮件的分拣自动化成为大势所趋,这就要求手写数字的识别能达到一个较高的准确率。
二、在财务、金融领域中的应用
金融财会、税务、金融是离线手写数字识别应用的又一重要领域。随着我国经济的迅速发展,每天等待处理的财会、税务报表、支票、付款等越来越多,如果能把它们用计算机自动处理,无疑可以节约大量的时间、金钱和劳力,更可以提高效率,节省成本。
三、在大规模数据统计中的应用
在数据统计、行业年检、人口普查等领域要进行大规模的数据统计,此时就需要输入大量的数据,完全的手工输入需要耗费大量人力物力,这时手写数字识别就可以发挥它强大的作用。目前国内的大多数实用系统都是要求用户在规范的方格内填写,因此这一类应用相对容易,对算法要求比较低。
随着经济的迅速发展,手写数字识别系统还会有更大的应用空间,这就要求手写数字的识别率达到一个更高水平。虽然数字笔划比较简单,类型也只有十种,但事实上,手写数字识别还有诸多难点,数字识别的准确率还有待提高。手写体数字识别的难点主要体现在以下几点:
一、数字的笔划简单,而且差别相对较小,使得准确区分诸如3与8或5与6等这些数字比较困难。
二、手写阿拉伯数字是全球通用的,使用者也不计其数。书写者具有个性化的书写习惯,即使同一书写者每次的书写结果也会有差异,这就造成了同一个数字形状的千差万别,很难做出可以兼顾各种手写而识别率极高的通用性数字识别系统。
三、在实际应用中,对数字识别率的要求要比普通文字识别要苛刻的多,识别精度要求达到更高的水平。这是因为手写数字识别没有上下文,不存在语意的相关性,数据中的每一个数字又都至关重要,识别不当可能引起经济纠纷。而数字识别经常涉及金融、财会等特殊领域,其对识别结果的严格性更是不言而喻。因此,国内外众多的学者都在为提高手写数字的识别率而努力。
随着信息技术的发展,数字识别技术往往与经济和商业相联系,投入使用的技术必须保证有较高的准确率,因为如果识别错误,即使是极小的错误,也可能会引起一系列的商业纠纷,甚至带来巨大的损失,造成无法挽回的结果。所以研究和开发过程中,为了避免一系列问题的出现,必须保证识别技术有较高的准确率,并且需要模型有较高的稳定性。较目前技术来看,大多数技术无法完成较高的识别准确率,并且不稳定,鲁棒性差;有些技术虽然可以达到较高的准确率,却需要一些复杂的预处理操作,比如对手写数字图片进行扭曲变形操作来扩充训练集、模拟各种抖动操作来对图像进行预处理操作等等,这样虽然可以实现较高的准确率,却降低了实用性,而且不能满足稳定性。
发明内容
本发明针对现实中对手写数字识别系统准确率的极高要求,提出一种基于卷积神经网络和支持向量机的手写数字识别方法,包括如下步骤:
(1):扩充手写数字图片训练集,原始的手写数字图片包括两部分,一部分标记为测试集,一部分标记为训练集,将训练集中手写数字图片进行平移扩充处理,增加训练集中图片的数量;训练集的平移扩充处理指通过批处理操作,将训练集中每张图片分别进行上下左右平移操作,平移大小均为一个像素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611136985.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图片文字的识别方法及装置
- 下一篇:一种便捷式发医疗卡装置