[发明专利]基于可微决策器和知识蒸馏的神经网络剪枝方法及系统在审
申请号: | 202111387877.7 | 申请日: | 2021-11-22 |
公开(公告)号: | CN114091668A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 李佳鑫;刘德荣;王永华;赵博 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策 知识 蒸馏 神经网络 剪枝 方法 系统 | ||
1.基于可微决策器和知识蒸馏的神经网络剪枝方法,其特征在于,包括以下步骤:
S1:对待剪枝的神经网络进行预训练;
S2:为预训练后的神经网络中的每一层卷积层构建一个可微决策器,并利用可微决策器对神经网络中的每一层卷积层进行采样并截断,得到每一层的剪枝率;
S3:根据神经网络中每一层的剪枝率和每一层的原始输出通道数,确定每一层剪枝后的输出通道数,对神经网络进行剪枝,得到剪枝后的神经网络;
S4:使用知识蒸馏方法对剪枝后的神经网络进行优化,得到优化后的神经网络;
S5:对优化后的神经网络进行训练,得到经过剪枝且恢复准确度的神经网络。
2.根据权利要求1所述的基于可微决策器和知识蒸馏的神经网络剪枝方法,其特征在于,S2具体包括以下步骤:
S2.1:为神经网络中的每一层卷积层添加一个可训练的可微决策器参数αi和一个预设的方差σ2,可微决策器参数αi和方差σ2组成高斯分布N(αi,σ2),所述高斯分布N(αi,σ2)为神经网络第i层的可微决策器;整体神经网络的可微决策器的公式如下所示:
D={N(α1,σ2),N(α2,σ2),N(α3,σ2),...,N(αn,σ2)}
其中,n表示要剪枝的网络的层数;
S2.2:使用可微决策器N(αi,σ2)对神经网络的第i层进行采样并截断,得到第i层的剪枝率ri,并计算出剪枝率ri对应的分布概率pi。
3.根据权利要求2所述的基于可微决策器和知识蒸馏的神经网络剪枝方法,其特征在于,S2还包括以下步骤:
S2.3:计算剪枝率ri对应的期望值Exi,具体包括以下步骤:
S2.3.1:使用可微决策器N(0,1)对神经网络的第i层采样得到数值ε;
S2.3.2:将xi=ε*σ+αi设为可微决策器N(αi,σ2)的采样结果,则剪枝率ri对应的期望值Exi=xi/M;其中,M为采样的次数。
4.根据权利要求3所述的基于可微决策器和知识蒸馏的神经网络剪枝方法,其特征在于,S3具体包括以下步骤:
S3.1:根据神经网络的第i层的剪枝率ri和第i层的原始输出通道数,确定第i层剪枝后的输出通道数ci,其公式如下所示:
ci=ri*cimax
其中,cimax表示第i层的原始输出通道数;
S3.2:根据输出通道数ci对神经网络的第i层进行剪枝,得到剪枝后的神经网络,具体为:将神经网络第i层的前ci个输出通道对应的输出特征图保留,其余的输出通道置零。
5.根据权利要求4所述的基于可微决策器和知识蒸馏的神经网络剪枝方法,其特征在于,S3还包括以下步骤:
S3.3:使用通道对齐方法,对剪枝后神经网络的第i层的输出特征图进行加权求和,将加权求和后的结果作为第i层的输出;
S3.4:根据剪枝率期望值Exi计算剪枝后神经网络的第i层的浮点运算数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111387877.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗菌内衣的制作工艺
- 下一篇:一种立式金属罐的铺尺器