[发明专利]一种神经网络压缩方法、电子设备及计算机可读介质在审
申请号: | 201811585964.1 | 申请日: | 2018-12-20 |
公开(公告)号: | CN111353598A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 压缩 方法 电子设备 计算机 可读 介质 | ||
1.一种神经网络压缩方法,其特征在于,包括:
获取第一输入数据;其中,所述第一输入数据包括第一权值矩阵;
将所述第一权值矩阵压缩为第二权值矩阵;其中,第二权值矩阵中包括至少两个子矩阵;
根据第二输入数据执行神经网络计算,其中,所述第二输入数据包括所述第二权值矩阵以及输入神经元数据。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一权值矩阵压缩为第二权值矩阵,包括:
将所述第一权值矩阵分解成第三权值矩阵;其中,所述第三权值矩阵包括至少两个子矩阵;
根据第一公式确定所述至少两个子矩阵中的每个子矩阵的大小,所述第一公式为Q≈Q1*Q2*......*Qn;其中,所述Q表示第一权值矩阵;所述Q1表示所述至少两个子矩阵中的第一子矩阵;所述Q2表示所述至少两个子矩阵中的第二子矩阵;所述Qn表示所述至少两个子矩阵中的第n子矩阵;
调整所述至少两个子矩阵中的每个子矩阵的大小,并通过训练压缩后的机器学习模型,以得到满足预设精度的第二权值矩阵。
3.根据权利要求2所述的方法,其特征在于,所述根据第一公式确定所述至少两个子矩阵中的每个子矩阵的大小,所述第一公式为Q≈Q1*Q2*......*Qn,包括:
根据所述第一公式和第二公式确定所述至少两个子矩阵中的每个子矩阵的大小,所述第二公式为||Q-Q1*Q2*......*Qn||≤T,其中,所述T表示预设的误差阈值。
4.根据权利要求2或3所述的方法,其特征在于,所述调整所述至少两个子矩阵中的每个子矩阵的大小,并通过训练压缩后的机器学习模型,以得到满足预设精度的第二权值矩阵,包括:
调整所述至少两个子矩阵中的每个子矩阵的大小,并通过训练压缩后的机器学习模型,以得到满足预设精度并且与所述第一权值矩阵之间的压缩比满足预设压缩比的第二权值矩阵。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述神经网络为全连接层神经网络;所述至少两个子矩阵包括两个子矩阵;所述第一公式包括:M≈M1*M2;所述两个子矩阵包括第一子矩阵M1和第二子矩阵M2,所述M1为Nin*K矩阵,所述M2为K*Nout矩阵;其中,K为压缩参数,Nin为所述神经网络的输入神经元的个数,Nout为所述神经网络的输出神经元的个数;所述压缩参数用于表征所述M1的输出神经元的个数以及所述M2的输入神经元的个数,所述K为大于0且小于等于min(Nin,Nout)的正整数。
6.根据权利要求2-4任一项所述的方法,其特征在于,所述神经网络为卷积层神经网络;所述卷积层神经网络包括Nfin*Nfout个卷积核;所述第一公式包括:F≈F1*F2;其中,F表示所述Nfin*Nfout个卷积核中的任意一个卷积核;所述F1为第一子卷积核;所述F2为第二子卷积核;所述第一子卷积核F1为(Kx,R),所述第二子卷积核F2为(R,Ky),(Kx,Ky)表示卷积核的大小,R为压缩参数,所述R为大于0且小于等于min(Kx,Ky)的正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811585964.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业数据库备份系统
- 下一篇:由用户设备执行的方法以及用户设备