[发明专利]一种基于卷积神经网络的图像识别方法有效
申请号: | 201711114919.3 | 申请日: | 2017-11-13 |
公开(公告)号: | CN107798381B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 钱燕芳;王敏;秦月红 | 申请(专利权)人: | 河海大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/46 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;姚兰兰 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 图像 识别 方法 | ||
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括以下几个步骤:
a、获取原始图像;
b、对所述原始图像进行预处理;
c、将预处理后的图像输入卷积神经网络中的第一个卷积层,再将结果输入到池化层;步骤c中,为了减少子网络输入与原始图像输入之间的误差,卷积神经网络结构中的第一个卷积层采用3×3的卷积核,步长为1,卷积层提取出的特征映射的大小为((W-F)/S)+1,其中,W是输入的大小,F是卷积核的大小,S是步长;所述池化层的滑动窗口大小为2×2,步长为2,越界时,以0填充,采用最大值的池化方式;
d、将上一层的输出结果输入到卷积神经网络中的子网络;所述子网络依次包含一个1×1卷积层,一个3×3的卷积层,一个5×5的卷积层,一个1×1卷积层和一个Pooling层;在提取特征的同时,子网络计算各层残差;
e、将上一层的输出结果输入到卷积神经网络中交替分布的卷积层和池化层;
f、将上一层的输出结果输入到卷积神经网络中的全连接层;
g、将上一层的输出结果输入到卷积神经网络中的最后一层,即Softmax层,得到图像属于各个类别的概率;
h、根据图像属于各个类别的概率,得出图像分类结果,最后输出图像分类结果;
所述子网络计算各层残差的方法分两种情况:
第一种:当前层l为卷积层,下一层l+1为Pooling层,则第l层的第j个feature map为:
其中,*是卷积符号,表示连接第(l-1)层第j个神经元到第l层第i个神经元之间的权值向量,表示第l层的第j个神经元的偏置项,则第l层的第j个feature map的残差计算公式为
其中,为采样层权值,为第l层卷积层的输出,这个运算符。代表矩阵的点乘,即对应元素相乘,up表示上采样操作;
第二种:当前层l为Pooling层,下一层l+1为卷积层,则第l层的第j个feature map为:
其中,表示对l-1层的输出做最大值Pooling操作,则第l层的第j个feature map的残差计算公式为
其中,表示第l+1层卷积层第j个feature map的权值矩阵,rot180表示对卷积核矩阵进行180度旋转,full表示卷积模式,conv2表示卷积操作;
随后利用主成分分析法对各层间特征残差和最后提取特征进行降维处理,最后对降维后的特征进行加法融合,获取特征融合后的特征表达,获得输出。
2.根据权利要求1所述的基于卷积神经网络的图像识别方法,其特征在于,步骤b中,所述预处理的方法即原始图像的每个位置上的像素值减去均值RGB。
3.根据权利要求1所述的基于卷积神经网络的图像识别方法,其特征在于,步骤c中,所有卷积层包括一个卷积层以及其后的一个ReLU层,ReLU激活函数的表达式是ReLU(x)=max(0,x),其中x表示卷积层的输出。
4.根据权利要求3所述的基于卷积神经网络的图像识别方法,其特征在于,步骤c中,为了与ReLU层的激活函数对应,卷积层的节点只与前一层的节点相连,每一条相连的线对应一个权重。
5.根据权利要求4所述的基于卷积神经网络的图像识别方法,其特征在于,所述卷积层的权值矩阵的初始化采用xavier方法,其初始化方法如下:
定义参数所在层的输入维度为n,输出维度为m,那么参数将以均匀分布的方式在的范围内进行初始化。
6.根据权利要求1所述的基于卷积神经网络的图像识别方法,其特征在于,步骤c中,步骤g中,Softmax层通过Softmax函数得到图像属于各个类别的概率,Softmax函数的表达式为:
其中,k表示图像分类的个数,zj表示节点属于第j类,zi表示节点属于第i类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711114919.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序