[发明专利]基于卷积神经网络和随机森林的手写数字识别方法在审
申请号: | 201710131513.X | 申请日: | 2017-03-07 |
公开(公告)号: | CN106991374A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 丁世飞;侯艳路;张楠;张健;赵星宇;曾凯 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 221116 江苏省徐*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 随机 森林 手写 数字 识别 方法 | ||
技术领域
本发明涉及模式识别和机器学习领域,具体涉及一种结合卷积神经网络和随机森林的手写数字识别方法。
背景技术
手写数字识别包含在字符识别技术中,是模式识别的一种。处理一些数据信息的关键技术就是手写数字识别,比如财务报表、邮政编码、各种票据等等。手写数字识别的改进和研究不仅具有重大的现实意义和应用价值,还有着极其关键的理论价值。
卷积神经网络(Convolutional Neural Network,CNN)是深度学习算法的一种,广泛应用在图像识别领域。CNN通过一层一层的学习,可以自动从输入图像中提取特征,在面对不同的图像识别任务时都有很好的效果,被认为是通用图像识别系统的代表之一。但是CNN在训练的过程中需要采用BP算法来调整参数,这个过程会消耗大量时间。随机权值的网络在近几年的研究中被证明同样可以取得很好的效果。
随机森林(Random Forests,RF)是Leo Breiman在2001年发表的论文中提出的一种新的机器学习算法,在分类和回归上具有很高的精度,训练速度快并且不容易出现过拟合的问题,在抗噪方面也表现良好,现有的基于随机森林的分类器都依赖手工选取的特征,然而手工选取是非常费力而且需要专业知识的方法,能否选好很大程度上取决于经验和运气。
发明内容
基于以上问题,本发明提出一种基于卷积神经网络和随机森林的手写数字识别方法,用随机权值的CNN提取数字图像的特征,然后交给RF完成分类。这样使得模型在提取特征的过程中大大减少了时间,既克服了CNN训练时间过长的问题,又解决了在RF在人工选取特征的缺陷。
本发明的技术方案如下:一种基于卷积神经网络和随机森林的手写体数字识别方法,具体步骤如下:
步骤1,采集手写数字图像生成训练集和测试集;
步骤2,构造并初始化卷积神经网络:该网络包括:输入层、两个卷积层、两个降采样层和一个全连接层,其中:输入层的数据是手写数字图像,是28*28像素点构成的矩阵,卷积层C1有10个特征图,降采样层S2同样有10个特征图,卷积层C3则有20个特征图,S4层对C3层特征图基础上进行降采样得到20张特征图,此时得到特征数据;
步骤3,训练随机森林分类器,随机森林是一种统计学习理论,它利用bootstrap重抽样方法从原始样本中抽取多个样本,然后对每个bootstrap样本进行决策树建模,然后组成多棵决策树进行预测,最终投票得出预测结果。具体过程如下:
步骤3.1:从样本集中用bootstrap采样选出n个样本;
步骤3.2:从所有属性中随机选择k个属性,选择最佳分割属性作为节点建立CART决策树;
步骤3.3:重复以上两步m次,即建立了m棵CART决策树,这m棵CART决策树形成随机森林,通过投票表决结果,决定数据属于哪一类。
步骤4:手写数字的识别,从卷积神经网络中得到特征数据之后,将特征数据输入到训练好的随机森林分类器中从而得到手写数字识别结果。
通过以上内容可知,本申请提供的是一种基于卷积神经网络和随机森林的手写体数字识别方法,首先手写数字图像的数据集,分为训练集和测试集,然后设计网络的层数、特征图的数目和卷积核的大小等等,之后用随机化权值的卷积神经网络提取数字图像的特征,最后输入到随机森林分类器中完成分类。本申请通过卷积神经网络提取手写数字图像的特征,避免了显示的特征提取,直接将图片作为网络的输入;避免了深度学习训练时间长的缺点,训练时间短;同时识别精度也比较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种手写体数字识别方法的流程图。
图2为本申请所使用的卷积神经网络结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
实施例1
如图1所示,本实施例包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710131513.X/2.html,转载请声明来源钻瓜专利网。