[发明专利]一种模型蒸馏方法、装置、电子设备及存储介质有效
申请号: | 202010607520.4 | 申请日: | 2020-06-28 |
公开(公告)号: | CN111738436B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 邹昆;侯卫东;董帅 | 申请(专利权)人: | 电子科技大学中山学院 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
地址: | 528400 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种模型蒸馏方法、装置、电子设备及存储介质,用于快速有效地将复杂神经网络模型的参数直接迁移到简化神经网络模型上。该方法包括:获得预先训练的第一网络模型和未经训练的第二网络模型,第一网络模型的网络参数多于第二网络模型的网络参数;从第一网络模型中的第一批量正则化层中提取出第一参数和第二参数,第一参数和第二参数均是可学习的,第一参数影响网络模型的特征分布的方差,第二参数影响网络模型的特征分布的均值;根据第一参数和第二参数对第二网络模型中的第二批量正则化层进行初始化,获得初始化后的第二网络模型;使用第一网络模型对初始化后的第二网络模型进行蒸馏训练,获得蒸馏训练后的第二网络模型。 | ||
搜索关键词: | 一种 模型 蒸馏 方法 装置 电子设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学中山学院,未经电子科技大学中山学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010607520.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种互换调节性高压接地开关
- 下一篇:模型升降输送机