[发明专利]卷积神经网络分数阶误差反向传播方法在审
申请号: | 201810490436.1 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108764472A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 赵丽玲;李远禄;张泽林 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 张立荣;吴扬帆 |
地址: | 210019 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 误差反向传播 分数阶 网络权 整数阶 导数 求导 方法更新 激活函数 训练数据 训练效率 有效缓解 拟合 网络 | ||
1.一种卷积神经网络分数阶误差反向传播方法,其特征在于包括如下步骤:
步骤1)选择卷积神经网络模型;
步骤2)利用分数阶误差反向传播方法更新网络权值;
步骤3)根据所述的网络权值,获取卷积神经网络参数。
2.根据权利要求1所述的卷积神经网络分数阶误差反向传播方法,其特征在于所述步骤1)具体包括:
步骤1-1)设定神经网络模型,所述神经网络模型包括一层输入层、n层隐藏层以及一层输出层,所述输入层、隐藏层、输出层的节点个数分别对应为n1,n2,1个;
步骤1-2)设定大量高分辨率图像{Xi}和其对应的低分辨率图像{Yi}组成的训练集,其中:X表示高分辨率图像,Y表示低分辨率图像,i表示图像索引;
步骤1-3)设定卷积神经网络的权值和偏置为Θ={W,B},设定误差函数和激活函数分别为L和σ,其中W表示权值,B为偏置。
3.根据权利要求1所述的卷积神经网络分数阶误差反向传播方法,其特征在于所述步骤2包括以下子步骤:
步骤2-1)网络初始化:初始化网络权值和偏置Θ={W1,B1},设置最大迭代次数;
步骤2-2)输入训练数据{Xi,Yi};
步骤2-3)设置初始迭代次数k=1;
步骤2-4)对网络权值进行优化;
步骤2-5)根据k=k+1更新迭代次数,并跳转到步骤2-4)。
4.根据权利要求3所述的卷积神经网络分数阶误差反向传播方法,其特征在于,
步骤2-4)对网络权值进行优化具体包括以下步骤:
步骤2-4-1)计算网络输出值;
步骤2-4-2)计算误差:采用所述误差函数L,计算网络输出值和真实值之间的误差,判断误差是否满足要求,如果满足要求,则网络训练结束转入步骤3);
如果不满足要求,则进行权值修正,进入步骤2-4-3);
步骤2-4-3)计算误差反向传播梯度中激活函数的分数阶导数,并计算每个神经元节点的分数阶导数;
步骤2-4-4)计算误差梯度;
步骤2-4-5)修正权值:根据误差关于权重的梯度,修正网络权值。
5.根据权利要求4所述的卷积神经网络分数阶误差反向传播方法,其特征在于,所述步骤2-4-3)中根据式(1)计算误差反向传播梯度中激活函数的分数阶导数:
其中,Gradl表示第l层的误差反向传播梯度,为激活函数的输入,即网络节点的输出,表示第(l-1)层的第个神经元连接到第层的第j个神经元的权重,表示第l层的第j个神经元的偏置,μ表示分数阶导数的阶次,⊙为矩阵对应位置乘积,表示矩阵或向量之间点对点的乘法运算;
根据式(2)计算每个神经元节点的分数阶导数:
其中,为分数阶微分算子,D为1阶微分算子,x表示神经网络节点的输出值,σ(x)表示激活函数,σ′(x)表示激活函数的1阶导数,μ表示分数阶微分的阶次,Γ(x)为Gamma函数,定义为且Re(x)>0。
6.根据权利要求4所述的卷积神经网络分数阶误差反向传播方法,其特征在于,步骤2-4-5)采用经典随机梯度下降法根据式(3)修正权值,
其中,i表示网络层数,η表示学习率,通过线搜索的方式获得,表示激活函数的分数阶导数。
7.根据权利要求2所述的基于卷积神经网络分数阶误差反向传播方法,其特征在于,步骤1-3)中的激活函数σ表达式如式(4):
其中,x为网络节点输出值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810490436.1/1.html,转载请声明来源钻瓜专利网。