[发明专利]神经网络训练方法、装置及计算机可读存储介质在审
申请号: | 201910907549.1 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110705691A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 李亮亮 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/62 |
代理公司: | 11722 北京钲霖知识产权代理有限公司 | 代理人: | 冯志云;李志新 |
地址: | 100190 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种神经网络训练方法及装置,其中,方法包括:获取待训练的神经网络的多个中间层输出的多个特征图;通过特征提取网络对多个特征图进行特征提取,分别得到每个中间层的第一特征输出;根据多个第一特征输出与待训练的神经网络输出的第二特征输出,计算得到第一损失;基于第一损失,调整多个中间层的参数。通过自蒸馏的方式,将神经网络模型自身的各中间层、以及各次迭代中提取的结果特征输出,作为自身的监督信号充分利用,能够更快的收敛结果,完成训练,节约了时间和资源。 | ||
搜索关键词: | 中间层 输出 特征提取 特征图 神经网络模型 神经网络输出 神经网络训练 监督信号 结果特征 神经网络 蒸馏 迭代 收敛 节约 网络 | ||
【主权项】:
1.一种神经网络训练方法,其中,所述方法包括:/n获取待训练的神经网络的多个中间层输出的多个特征图;/n通过特征提取网络对所述多个特征图进行特征提取,分别得到每个所述中间层的第一特征输出;/n根据多个所述第一特征输出与所述待训练的神经网络输出的第二特征输出,计算得到第一损失;/n基于所述第一损失,调整所述多个中间层的参数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910907549.1/,转载请声明来源钻瓜专利网。