[发明专利]图像分类卷积神经网络结构的构建方法有效
申请号: | 201710106457.4 | 申请日: | 2017-02-27 |
公开(公告)号: | CN106874956B | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | 马苗;刘琳;武杰;陈昱莅;裴炤 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 西安永生专利代理有限责任公司 61201 | 代理人: | 申忠才 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种图像分类卷积神经网络结构的构建方法,由构建卷积神经网络结构、卷积神经网络训练和测试步骤组成。构建卷积神经网络结构的步骤为:获得训练样本图像和测试样本图像并对其进行预处理、设定卷积神经网络初始结构、引入激活函数、确定池化方法、确定滤波器、确定卷积层个数,得到图像分类卷积神经网络结构;卷积神经网络的训练和测试步骤为:用K‑Means聚类方法获得含有20个特征图的卷积层的滤波器,经前向传播和反向传播更新网络权值矩阵至最大训练次数,得到训练好的卷积神经网络,对测试样本图像进行测试,得到验证后的图像分类卷积神经网络结构,具有构建方法简单、有效等优点,适用于门牌号码、手写数字、邮政编码等图像分类。 | ||
搜索关键词: | 图像 分类 卷积 神经网络 结构 构建 方法 | ||
【主权项】:
1.一种图像分类卷积神经网络结构的构建方法,由构建卷积神经网络结构、卷积神经网络训练和测试步骤组成,其特征在于所述的构建卷积神经网络结构步骤如下:(1)获得训练样本图像和测试样本图像并对其进行预处理(a)从图像数据集中选取50400~73257张训练样本图像和6000~26032张测试样本图像;(b)对50400~73257张训练样本图像进行预处理包括图像灰度化、图像减均值步骤:图像灰度化:用(1)式对被训练的样本图像进行灰度化处理,将彩色图像转为灰度图像:I=W1×R+W2×G+W3×B (1)式中I为灰度化后的图像,R为彩色图像的红色分量,G为彩色图像的绿色分量,B为彩色图像的蓝色分量,W1为彩色图像的红色分量的权重,W2为彩色图像的绿色分量的权重,W3为彩色图像的蓝色分量的权重;图像减均值:用(2)式对已被灰度化的训练样本图像进行减均值处理:
式中Z为减均值后的图像,vi为n个图像中的第i个图像的像素矩阵,n为50400~73257整数个图像;(c)对6000~26032张测试样本图像进行预处理测试样本图像的预处理与对训练样本进行预处理步骤(b)相同;(2)设定卷积神经网络初始结构设定卷积神经网络初始结构:输入层(1)是50400~73257张大小为28×28或32×32的训练样本图像,输入层(1)后连接含有20个特征图的卷积层(2),含有20个特征图的卷积层(2)后连接含有20个特征图的池化层(3),含有20个特征图的池化层(3)后连接含有64个特征图的卷积层(2),含有64个特征图的卷积层(2)后连接含有64个特征图的池化层(3),含有64个特征图的池化层(3)后连接含有500个特征图的卷积层(2),含有500个特征图的卷积层(2)后连接全连接层(4),全连接层(4)后连接输出层(5);(3)引入激活函数在每个卷积层(2)后引入ReLu激活函数为:yi=max{xi,0} (3)式中xi为与前一层输出相连的第i个权值矩阵与当前层输入的内积,即卷积结果,yi为第i个特征图的输出,20≤i≤500;(4)确定池化方法卷积神经网络中的池化层(3)选用最大池化方法或均值池化方法或随机池化方法进行池化;(5)确定滤波器在3×3~9×9方阵之间、以图像宽度28或32为步长,在20~500内进行网格搜索,得到滤波器,为卷积层(2)的权值矩阵,滤波器的大小在3×3~9×9方阵之间,个数在20~500之间;(6)确定卷积层(2)个数在含有20个特征图的池化层(3)后增加一层卷积层(2),其滤波器大小和个数与含有20个特征图的卷积层(2)的滤波器大小和个数相同,通过式(4)得到该卷积层(2)特征图的大小,在含有64个特征图的池化层(3)后增加或不增加一层卷积层(2),若增加一层卷积层,其滤波器大小和个数与含有64个特征图的卷积层(2)的滤波器大小和个数相同,通过式(4)得到该卷积层(2)特征图的大小,卷积层(2)个数为3~5层,选择使得卷积神经网络对所选测试样本图像6000~26032张分类效果最好时的卷积层(2)个数,得到图像分类卷积神经网络结构:o=I*-m+1 (4)式中I*为本层输入矩阵的长,m为滤波器的像素矩阵长,o为卷积层(2)特征图的像素矩阵长;所述的卷积神经网络的训练和测试步骤为:(1)用K‑Means聚类方法获得含有20个特征图的卷积层(2)的权值矩阵(a)从训练集中随机选取N个m×m矩阵大小的图像块,N为所选取图像块有限的正整数,m为含有20个特征图的卷积层(2)的滤波器的像素矩阵长,m为3~9;(b)用式(5)对步骤(a)中所选取的N个图像块中的每一个图像块进行归一化处理:
式中x*为m×m矩阵大小的图像块,μ为N个图像块的平均值,σ为N个图像块的标准差,x表示经过归一化后的结果;(c)以式(6)为目标函数,对上步得到的图像块进行10次K‑Means聚类方法,取其中目标函数值最小的一次所得到的20个聚类中心,作为含有20个特征图的卷积层(2)的滤波器初始化值:
式中k为20是聚类个数,s表示图像块的类别数,xj为第i类别中的图像块,
为第i类的样本均值,i为1~20的整数;(2)将预处理后的50400~73257张训练样本图像输入图像分类卷积神经网络结构,经过前向传播和反向传播两个步骤反复循环更新网络的权值矩阵,直至达到30~70次数,训练过程结束,得到训练好的卷积神经网络;(3)将预处理后的6000~26032张测试样本图像输入到训练好的卷积神经网络进行测试,得到验证后的图像分类卷积神经网络结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710106457.4/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序