[发明专利]一种基于空间金字塔的卷积神经网络的图像分类方法有效
申请号: | 201710198700.X | 申请日: | 2017-03-29 |
公开(公告)号: | CN106991440B | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 王改华;吕朦;李涛;袁国亮 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 42222 武汉科皓知识产权代理事务所(特殊普通合伙) | 代理人: | 魏波 |
地址: | 430068 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空间 金字塔 卷积 神经网络 图像 分类 算法 | ||
1.一种基于空间金字塔的卷积神经网络的图像分类方法,其特征在于,包括以下步骤:
步骤1:前向传播,具体实现包括以下子步骤:
步骤1.1:建立带M个卷积层、M-1个池化层的前半部分卷积神经网络;
步骤1.2:将M个卷积层分别进行池化,得到M类特征,然后分别将其连接成一个大的特征向量,最后再连接成一个总的特征向量作为图像的最终特征;
步骤1.2中,若步骤1.1中建立的是带有3个卷积层、2个池化层的前半部分卷积神经网络,则将3个卷积层分别进行池化,得到3类特征;步骤1.2的具体实现过程如下:
输入图片后通过卷积核和隐层偏置获得第一个卷积层的特征图,第一层的卷积特征图x1由如下公式得到;
其中:表示第1个卷积层的第j张特征图,表示输入图片经过预处理后x0的第i张图片,n0表示x0图片的张数;表示第1层的第j个二维卷积核,表示第1个隐层第j个特征图的偏置;δ表示sigmiod函数,mp表示得到的为特征图;
n1为第一层的卷积核个数,也是第1个卷积特征图的张数;
将获得的卷积层特征图经过2*2的均匀池化进行下采样,得到行列均为原来一半的特征图v1;
v1=mean-pooling{x1};
其中,mean-pooling表示均匀池化
则每一个卷积层的特征图都能通过以下公式得到;
每一个池化层的特征图都能通过以下公式得到;
vl=mean-pooling{xl};
共计得到3个卷积层的特征图,即x1,x2,x3,然后将3个卷积层的特征图进行画网格的方式进行特征提取;
将第1个卷积层画分为4*4的网格,然后每个网格通过均匀池化提取一个特征,最终第1个卷积层经过特征提取后成为一个4*4的特征图p1;
p1=mean-pooling(v1);
同理根据以下公式得到3类特征图p1,p2,p3;
pl=mean-pooling(vl);
其中,池化窗口大小和步长随着输入图片大小的改变而改变;p1,p2,p3的大小分别为预设的4*4,2*2,1*1;然后将按列聚合成大小为16的列向量,p1聚合成16*6=96的列向量,同理可将p2聚合为大小为2*2*16=64的列向量,将p3聚合为大小为1*1*120=120的列向量,最后按序聚合成一个总大小为280的列向量p作为输入图片的特征;
步骤1.3:对最终特征向量进行一次全连接和softmax分类,获得卷积神经网络;
步骤1.4:将整个卷积神经网络的所有权值通过经验公式进行初始化,然后将训练图片x输入初始化后的卷积神经网络,按照前向传播公式进行传播;
步骤2:反向调节。
2.根据权利要求1所述的基于空间金字塔的卷积神经网络的图像分类方法,其特征在于,步骤1.4中所述将整个卷积神经网络的所有权值通过经验公式进行初始化,是根据经验公式初始化随机生成输入单元与隐层单元之间的权值wkj和隐层单元的偏置bj,
设置b初始值均为0;
其中,w表示权值,l表示卷积网络第l层,j表示卷积神经网络第l卷积层第j个神经元,k表示全连接层第k层,layerinput表示这一层输入神经元个数,layeroutput表示这一层的输出神经元个数;kl是第l个卷积层卷积核的大小,此公式可以令初始化的权值在-1到1之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710198700.X/1.html,转载请声明来源钻瓜专利网。