[发明专利]一种DNN层深关联学习率动态学习方法在审

专利信息
申请号: 201911392526.8 申请日: 2019-12-30
公开(公告)号: CN111105036A 公开(公告)日: 2020-05-05
发明(设计)人: 朱锦雷;井焜;孙涛;张传锋 申请(专利权)人: 神思电子技术股份有限公司
主分类号: G06N3/08 分类号: G06N3/08
代理公司: 济南泉城专利商标事务所 37218 代理人: 赵玉凤
地址: 250000 山东省济南市*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 dnn 关联 学习 动态 学习方法
【权利要求书】:

1.一种DNN层深关联学习率动态学习方法,其特征在于:为DNN所有带参网络层均增加一个只调节本层学习速率的学习参数LLR,LLR的初始值通过手动设定,基于现有的损失函数在训练过程中动态调整LLR数值,并且各层的LLR数值在调整过程中遵循曲线冲击调整方法,即学习参数在调整时,学习参数的调整曲线随训练次数震荡,并且震荡区间随着训练次数增加而逐步递减。

2.根据权利要求1所述的DNN层深关联学习率动态学习方法,其特征在于:所述带参网络层指DNN网络中需要通过训练确定参数的层,包括卷积层、池化层、缩放层、归一化层、叠加层和全连接层。

3.根据权利要求1所述的DNN层深关联学习率动态学习方法,其特征在于:学习参数的调整曲线为衰减型周期震荡学习曲线,包括衰减的三角曲线和正弦曲线。

4.根据权利要求1或3所述的DNN层深关联学习率动态学习方法,其特征在于:所述学习参数的调整曲线为:

LLRF(N)= (1/2)*(F1(N)-F2(N))*sin(w*N)+(1/2)*(F1(N)+F2(N)),

其中,F1(N)、F2(N)为两个衰减型指数,

F1(N)= b*exp(-a*N),

F2(N)= c*exp(-d*N),

a、b、c、d、w为常数,N为训练迭代次数。

5.根据权利要求1所述的DNN层深关联学习率动态学习方法,其特征在于:基于现有的损失函数在训练过程中动态调整LLR数值的过程为:损失函数对LLR进行求导,求导结果记为▽,则LLR(k)=LLR(k-1)-LLRF(k)*▽,即第k次迭代调整时LLR值为上次LLR值减去LLRF(k)*▽,LLRF(k)为第k次迭代调整时学习参数调整曲线对应的取值。

6.根据权利要求1所述的DNN层深关联学习率动态学习方法,其特征在于:基于现有的损失函数在训练过程中对LLR外的其它参数动态调整的过程为:损失函数对进行θ求导,求导结果记为▽,θ表示除LLR外的其他参数,则θ(k)=θ(k-1)-LLR*▽,即第k次迭代调整时θ值为上次θ值减去LLR*▽,LLR为针对本带参网络层设置的学习参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神思电子技术股份有限公司,未经神思电子技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911392526.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top