[发明专利]一种基于卷积神经网络图像识别方法有效

申请号：	202010829114.2	申请日：	2020-08-18
公开（公告）号：	CN112115973B	公开（公告）日：	2022-07-19
发明（设计）人：	刘航;白仞祥;张玉红;菅秀凯;刘鸣泰	申请（专利权）人：	吉林建筑大学
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/774;G06K9/62;G06V10/82;G06N3/04;G06N3/08
代理公司：	沈阳铭扬联创知识产权代理事务所(普通合伙) 21241	代理人：	屈芳
地址：	130033 吉***	国省代码：	吉林;22
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于卷积神经网络图像识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于涉及深度学习，图像识别技术，具体的来讲为一种基于卷积神经网络图像识别方法。该方法包括：将原始图片采用卷积神经网络进行模型训练；将待处理图片输入到训练好的模型，进行图片的识别。本发明方法在训练过程通过采用GPU模式来加速神经网络的训练，在训练模型中加入了Dropout正则化对系统进行优化处理来防止训练过程中发生过拟合现象，同时对数据集照片进行图集扩充。

技术领域

本发明属于涉及深度学习，图像识别技术，具体的来讲为一种基于卷积神经网络图像识别方法。

背景技术

自1985年Rumelhart和他的同时发展了学习算法以来，在世界范围内掀起了探索和研究神经网络的热潮，人工神经网络的发展已经渗透到个中研究领域，尤其在模式识别的图像分类技术方面应用逐渐增多，国内外研究较多的有字符识别技术、车牌识别技术、脸部识别技术、各种纸币识别技术、印章识别技术以及对一些军事目标的识别等方面。人工神经网络在完成图像识别任务时，主要有以下几个方面的问题：

(1)参数数量太多，在CIFAR-10(一个比赛数据集)中，图像只有大小为32x32x3(32宽，32高，3色通道)，因此在正常神经网络的第一隐藏层中的单个完全连接的神经元将具有32x32x3＝3072个权重。这个数量仍然是可控的，但显然这个完全连接的结构不会扩大到更大的图像。例如，一个更可观的大小的图像，例如200x200x3的图像，则会导致120,000个权重的神经元。此外，我们几乎肯定会有几个这样的神经元，所以参数会增多。显然，这种完全连接是浪费的，而且大量的参数会很快导致过度配套。

(2)没有利用像素之间的位置信息。对于图像识别任务来说，每个像素和其周围像素的联系是比较紧密的，和离得很远的像素的联系可能就很小了。如果一个神经元和上一层所有神经元相连，那么就相当于对于一个像素来说，把图像的所有像素都等同看待，这不符合前面的假设。当我们完成每个连接权重的学习之后，最终可能会发现，有大量的权重，它们的值都是很小的。努力学习大量并不重要的权重，这样的学习必将是非常低效的。

(3)网络层数限制。网络层数越多其表达能力越强，但是通过梯度下降方法训练深度人工神经网络很困难，因为全连接神经网络的梯度很难传递超过3层。因此，不可能得到一个很深的全连接神经网络，也就限制了它的能力。

发明内容

为了解决现有技术中存在的问题，本发明所要解决的技术问题在于提供一种基于卷积神经网络图像识别方法。

本发明是这样实现的，

一种基于卷积神经网络图像识别方法，该方法包括：

步骤1，将原始图片采用卷积神经网络进行模型训练；

步骤2，将待处理图片输入到训练好的模型，进行图片的识别。

进一步地：所述步骤2采用卷积神经网络进行模型训练包括：通过卷积层初步提取图像特征；通过下采样层提取主要特征；

通过全连接层将各部分特征汇总；产生分类器，进行预测识别；

具体包括：

步骤11：对卷积神经网络进行权值的初始化；

步骤12：对输入的图片数据经过卷积层、下采样层、全连接层的向前传播得到输出值；