[发明专利]神经网络参数矩阵的稀疏化方法和装置在审
申请号: | 201910814977.X | 申请日: | 2019-08-30 |
公开(公告)号: | CN110516806A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 蒋泳森 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06F17/16 |
代理公司: | 11400 北京商专永信知识产权代理事务所(普通合伙) | 代理人: | 黄谦;邓婷婷<国际申请>=<国际公布>= |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 稀疏 神经网络参数 矩阵 方法和装置 迭代训练 增量式 冗余 算法 存储空间 对置 更新 申请 网络 | ||
1.一种神经网络参数矩阵的稀疏化方法,包括:
在对神经网络参数进行每一轮迭代训练之前,选出所述神经网络参数矩阵中最冗余的多个参数;
将所述最冗余的多个参数置0;
对置0后的参数进行标记并在之后的迭代训练过程中不再更新标记后的参数。
2.根据权利要求1所述的方法,其中,所述在对神经网络参数进行每一轮迭代训练之前,选出所述神经网络参数矩阵中最冗余的多个参数包括:
在对神经网络参数进行每一轮迭代训练之前,将所述神经网络参数矩阵中非0的参数按照绝对值大小的顺序排列;
基于预设比例选出绝对值最小的多个参数为最冗余的多个参数。
3.根据权利要求2所述的方法,其中,所述方法还包括:
在对神经网络参数进行下一轮迭代训练之前,从未被标记的参数中选出所述神经网络参数矩阵中最冗余的多个参数;
将所述最冗余的多个参数置0;
对置0后的参数进行标记并在之后的迭代训练过程中不再更新标记后的参数。
4.根据权利要求1所述的方法,其中,所述在对神经网络参数进行每一轮迭代训练之前,选出所述神经网络参数矩阵中最冗余的多个参数包括:
在对神经网络参数进行每一轮迭代训练之前,将所述神经网络参数矩阵中的参数的绝对值和预设阈值进行比较;
如果多个参数的绝对值小于所述预设阈值,将所述多个参数确定为最冗余的多个参数。
5.根据权利要求4所述的方法,其中,所述方法还包括:
如果某些参数的绝对值大于等于所述预设阈值,将所述某些参数确定为非冗余参数。
6.根据权利要求1-5中任一项所述的方法,其中,所述对所选出置0的参数进行标记包括:
记录所述置0后的参数在所述神经网络参数矩阵中的索引位置。
7.一种神经网络参数矩阵的稀疏化装置,包括:
冗余参数选择模块,配置为在对神经网络参数进行每一轮迭代训练之前,选出所述神经网络参数矩阵中最冗余的多个参数;
置0模块,配置为将所述最冗余的多个参数置0;
标记模块,配置为对置0后的参数进行标记并在之后的迭代训练过程中不再更新标记后的参数。
8.根据权利要求7所述的装置,其中,所述冗余参数选择模块进一步配置为:
在对神经网络参数进行每一轮迭代训练之前,将所述神经网络参数矩阵中非0的参数按照绝对值大小的顺序排列;
基于预设比例选出绝对值最小的多个参数为最冗余的多个参数。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910814977.X/1.html,转载请声明来源钻瓜专利网。