[发明专利]一种DNN层深关联学习率动态学习方法在审
申请号: | 201911392526.8 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111105036A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 朱锦雷;井焜;孙涛;张传锋 | 申请(专利权)人: | 神思电子技术股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 赵玉凤 |
地址: | 250000 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 dnn 关联 学习 动态 学习方法 | ||
1.一种DNN层深关联学习率动态学习方法,其特征在于:为DNN所有带参网络层均增加一个只调节本层学习速率的学习参数LLR,LLR的初始值通过手动设定,基于现有的损失函数在训练过程中动态调整LLR数值,并且各层的LLR数值在调整过程中遵循曲线冲击调整方法,即学习参数在调整时,学习参数的调整曲线随训练次数震荡,并且震荡区间随着训练次数增加而逐步递减。
2.根据权利要求1所述的DNN层深关联学习率动态学习方法,其特征在于:所述带参网络层指DNN网络中需要通过训练确定参数的层,包括卷积层、池化层、缩放层、归一化层、叠加层和全连接层。
3.根据权利要求1所述的DNN层深关联学习率动态学习方法,其特征在于:学习参数的调整曲线为衰减型周期震荡学习曲线,包括衰减的三角曲线和正弦曲线。
4.根据权利要求1或3所述的DNN层深关联学习率动态学习方法,其特征在于:所述学习参数的调整曲线为:
LLRF(N)= (1/2)*(F1(N)-F2(N))*sin(w*N)+(1/2)*(F1(N)+F2(N)),
其中,F1(N)、F2(N)为两个衰减型指数,
F1(N)= b*exp(-a*N),
F2(N)= c*exp(-d*N),
a、b、c、d、w为常数,N为训练迭代次数。
5.根据权利要求1所述的DNN层深关联学习率动态学习方法,其特征在于:基于现有的损失函数在训练过程中动态调整LLR数值的过程为:损失函数对LLR进行求导,求导结果记为▽,则LLR(k)=LLR(k-1)-LLRF(k)*▽,即第k次迭代调整时LLR值为上次LLR值减去LLRF(k)*▽,LLRF(k)为第k次迭代调整时学习参数调整曲线对应的取值。
6.根据权利要求1所述的DNN层深关联学习率动态学习方法,其特征在于:基于现有的损失函数在训练过程中对LLR外的其它参数动态调整的过程为:损失函数对进行θ求导,求导结果记为▽,θ表示除LLR外的其他参数,则θ(k)=θ(k-1)-LLR*▽,即第k次迭代调整时θ值为上次θ值减去LLR*▽,LLR为针对本带参网络层设置的学习参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神思电子技术股份有限公司,未经神思电子技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911392526.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:检索和相似度分析一体化的方法、装置和存储介质
- 下一篇:机器人二次开发方法