[发明专利]基于卷积神经网络与支持向量机的手写数字识别方法在审

专利信息
申请号: 201611136985.6 申请日: 2016-12-12
公开(公告)号: CN106599941A 公开(公告)日: 2017-04-26
发明(设计)人: 李阳阳;周林浩;焦李成;刘芳;尚荣华;马文萍;马晶晶;缑水平 申请(专利权)人: 西安电子科技大学
主分类号: G06K9/68 分类号: G06K9/68;G06K9/62;G06N3/04;G06N3/08
代理公司: 陕西电子工业专利中心61205 代理人: 程晓霞,王品华
地址: 710071 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 卷积 神经网络 支持 向量 手写 数字 识别 方法
【说明书】:

技术领域

发明属于图像处理与模式识别中的技术领域,特别涉及手写数字的识别,具体是一种基于卷积神经网络与支持向量机的手写数字识别方法,在邮政、税务、交通、金融等行业的实践活动中有着极其广泛的应用。

背景技术

手写数字识别隶属于手写体字符识别的一个范畴,手写体识别又分为在线手写体识别和离线手写体识别。在线手写体识别通过记录文字图像抬笔、落笔、笔迹上各像素的空间位置,以及各笔段之间的时间关系等信息,对这些信息进行处理,在处理过程中,系统以一定的规则提取信息特性,再由识别模块将信息特征与识别库的特征进行比较,加以识别,最后转化为计算机所使用的文字代码。离线手写体识别相对于前者来说没有笔划信息,因此难度更大、应用更广泛,如银行票据、工商报表、财务报表、统计报表等各种表格系统,是目前研究的一个重点,也是一个难点,本发明属于离线手写体识别范畴。

随着信息网络的推广,有大量的数据要输入计算机网络。而且在现代信息社会,方方面面都要与数字打交道,数字与人们的日常生活息息相关。目前手写数字识别主要的应用有以下三个领域。

一、在邮件分拣中的应用

在邮件的自动分拣中,离线手写数字识别往往与人工辅助识别等手段相结合,完成邮政编码的阅读;然而在一些大中型城市,每天要处理的邮件量高达几百万件,业务量的急剧上升使得邮件的分拣自动化成为大势所趋,这就要求手写数字的识别能达到一个较高的准确率。

二、在财务、金融领域中的应用

金融财会、税务、金融是离线手写数字识别应用的又一重要领域。随着我国经济的迅速发展,每天等待处理的财会、税务报表、支票、付款等越来越多,如果能把它们用计算机自动处理,无疑可以节约大量的时间、金钱和劳力,更可以提高效率,节省成本。

三、在大规模数据统计中的应用

在数据统计、行业年检、人口普查等领域要进行大规模的数据统计,此时就需要输入大量的数据,完全的手工输入需要耗费大量人力物力,这时手写数字识别就可以发挥它强大的作用。目前国内的大多数实用系统都是要求用户在规范的方格内填写,因此这一类应用相对容易,对算法要求比较低。

随着经济的迅速发展,手写数字识别系统还会有更大的应用空间,这就要求手写数字的识别率达到一个更高水平。虽然数字笔划比较简单,类型也只有十种,但事实上,手写数字识别还有诸多难点,数字识别的准确率还有待提高。手写体数字识别的难点主要体现在以下几点:

一、数字的笔划简单,而且差别相对较小,使得准确区分诸如3与8或5与6等这些数字比较困难。

二、手写阿拉伯数字是全球通用的,使用者也不计其数。书写者具有个性化的书写习惯,即使同一书写者每次的书写结果也会有差异,这就造成了同一个数字形状的千差万别,很难做出可以兼顾各种手写而识别率极高的通用性数字识别系统。

三、在实际应用中,对数字识别率的要求要比普通文字识别要苛刻的多,识别精度要求达到更高的水平。这是因为手写数字识别没有上下文,不存在语意的相关性,数据中的每一个数字又都至关重要,识别不当可能引起经济纠纷。而数字识别经常涉及金融、财会等特殊领域,其对识别结果的严格性更是不言而喻。因此,国内外众多的学者都在为提高手写数字的识别率而努力。

随着信息技术的发展,数字识别技术往往与经济和商业相联系,投入使用的技术必须保证有较高的准确率,因为如果识别错误,即使是极小的错误,也可能会引起一系列的商业纠纷,甚至带来巨大的损失,造成无法挽回的结果。所以研究和开发过程中,为了避免一系列问题的出现,必须保证识别技术有较高的准确率,并且需要模型有较高的稳定性。较目前技术来看,大多数技术无法完成较高的识别准确率,并且不稳定,鲁棒性差;有些技术虽然可以达到较高的准确率,却需要一些复杂的预处理操作,比如对手写数字图片进行扭曲变形操作来扩充训练集、模拟各种抖动操作来对图像进行预处理操作等等,这样虽然可以实现较高的准确率,却降低了实用性,而且不能满足稳定性。

发明内容

本发明针对现实中对手写数字识别系统准确率的极高要求,提出一种基于卷积神经网络和支持向量机的手写数字识别方法,包括如下步骤:

(1):扩充手写数字图片训练集,原始的手写数字图片包括两部分,一部分标记为测试集,一部分标记为训练集,将训练集中手写数字图片进行平移扩充处理,增加训练集中图片的数量;训练集的平移扩充处理指通过批处理操作,将训练集中每张图片分别进行上下左右平移操作,平移大小均为一个像素。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611136985.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top