[发明专利]基于残差结构剪枝的模型压缩方法、装置、设备及介质在审
| 申请号: | 202210071249.6 | 申请日: | 2022-01-21 |
| 公开(公告)号: | CN114429208A | 公开(公告)日: | 2022-05-03 |
| 发明(设计)人: | 曹堃;陈志宇;龙晓华 | 申请(专利权)人: | 深圳市同为数码科技股份有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李燕娥 |
| 地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 结构 剪枝 模型 压缩 方法 装置 设备 介质 | ||
1.基于残差结构剪枝的模型压缩方法,其特征在于,所述方法包括:
对目标检测网络模型进行神经网络训练以获取mAP基线;
在对目标检测网络模型的损失函数添加针对BN层缩放因子的范数之后对模型进行训练;
在完成训练后,根据缩放因子的大小对训练完成后的目标检测网络模型进行剪枝处理;
对剪枝处理后的目标检测网络模型进行微调训练。
2.根据权利要求1所述的基于残差结构剪枝的模型压缩方法,其特征在于,所述的在完成训练后,根据缩放因子的大小对训练完成后的目标检测网络模型进行剪枝处理,具体包括:
提取所有可剪枝BN层的通道的权重以及所有可剪枝BN层对应的正则化参数;
从大到小排列所有可剪枝BN层对应的正则化参数,并根据设定的剪枝幅度确定出正则化参数阈值;
根据正则化参数阈值计算出每一个可剪枝的BN层的剪枝通道和剩余通道,即为目标结构;
创建针对目标结构的新模型;
将正则化参数大于正则化参数阈值的通道的权重从已训练好的目标检测网络模型中复制到新模型中。
3.根据权利要求1所述的基于残差结构剪枝的模型压缩方法,其特征在于,所述针对BN层缩放因子的范数为L1范数。
4.基于残差结构剪枝的模型压缩装置,其特征在于,所述装置包括第一训练单元、第二训练单元、剪枝单元和微调训练单元;
所述第一训练单元,用于对目标检测网络模型进行神经网络训练以获取mAP基线;
所述第二训练单元,用于在对目标检测网络模型的损失函数添加针对BN层缩放因子的范数之后对模型进行训练;
所述剪枝单元,用于在完成训练后,根据缩放因子的大小对训练完成后的目标检测网络模型进行剪枝处理;
所述微调训练单元,用于对剪枝处理后的目标检测网络模型进行微调训练。
5.根据权利要求4所述的基于残差结构剪枝的模型压缩装置,其特征在于,所述剪枝单元包括提取模块、排列模块、计算模块、创建模块和复制模块;
所述提取模块,用于提取所有可剪枝BN层的通道的权重以及所有可剪枝BN层对应的正则化参数;
所述排列模块,用于从大到小排列所有可剪枝BN层对应的正则化参数,并根据设定的剪枝幅度确定出正则化参数阈值;
所述计算模块,用于根据正则化参数阈值计算出每一个可剪枝的BN层的剪枝通道和剩余通道,即为目标结构;
所述创建模块,用于创建针对目标结构的新模型;
所述复制模块,用于将正则化参数大于正则化参数阈值的通道的权重从已训练好的目标检测网络模型中复制到新模型中。
6.根据权利要求4所述的基于残差结构剪枝的模型压缩装置,其特征在于,所述针对BN层缩放因子的范数为L1范数。
7.一种计算机设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~3中任意一项所述的方法步骤。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,使得所述处理器执行如权利要求1~3任意一项所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市同为数码科技股份有限公司,未经深圳市同为数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210071249.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种千张切丝装置
- 下一篇:一种高温抗氧剂溶液及其制备方法





