[发明专利]基于特征图变化对卷积神经网络剪枝的方法在审
| 申请号: | 201711011383.2 | 申请日: | 2017-10-26 |
| 公开(公告)号: | CN109711528A | 公开(公告)日: | 2019-05-03 |
| 发明(设计)人: | 王瑜;江帆;盛骁;韩松;单羿 | 申请(专利权)人: | 北京深鉴智能科技有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04 |
| 代理公司: | 北京卓孚知识产权代理事务所(普通合伙) 11523 | 代理人: | 刘光明;任宇 |
| 地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 剪枝 特征图 卷积神经网络 整个网络 敏感度 卷积 过滤器 中过滤器 去除 网络 压缩 分析 | ||
本公开提供一种基于特征图变化对卷积神经网络剪枝的方法。本发明通过将卷积层中的部分过滤器去除的方式实现了对整个网络的压缩,这一过程称为剪枝。本发明主要贡献是根据特征图的变化情况确定单个卷积层中过滤器的剪枝准则,利用该准则对网络敏感度进行分析,并最终根据网络的敏感度对整个网络进行剪枝。
技术领域
本发明涉及人工神经网络,更具体涉及基于特征图变化对卷积神经网络剪枝。
背景技术
近年来,随着深度学习(Deep Learning)技术的发展,人工神经网络(ArtificialNeural Networks, ANN)被应用在越来越多的领域。卷积神经网络(Convolution NeuralNetwork, CNN)是其中具有代表性的一种网络结构,它在图像处理、语音识别、自然语言处理等领域都有应用。特别是在图像处理方面,得益于网络结构的不断加深,卷积神经网络取得了很大的成功。与此同时,不断加深的网络也使得网络的训练和推理所需的计算资源也成倍的增加,这极大的限制了卷积神经网络的应用场景。
于是,针对神经网络进行压缩的相关技术变得越来越重要。常见的网络压缩技术包括剪枝(pruning)、量化(quantization)、蒸馏(distilling)等。
发明内容
本发明所提出的方法是剪枝技术的一种,通过将网络中的某些“连接”去除,可以有效地减少模型所需的参数量和计算量。
本发明提供一种基于特征图变化对卷积神经网络剪枝的方法。
根据本发明的第一方面,提供一种在卷积神经网络中基于特征图变化对卷积层中的过滤器进行剪枝的方法,其中,对于包含n个过滤器的第i个卷积层,期望移除掉其中的m个过滤器,所述方法包括:(1)对原始的神经网络模型运行一次前向计算,得到第i+k个卷积层生成的特征图x,其中k为任意正整数;(2)遍历第i个卷积层中的所有n个过滤器;(3)将当前遍历到的第j个过滤器移除掉,其余过滤器与原始网络模型相同,生成一个新的模型;(4)在新模型上运行一次前向计算,得到第i+k个卷积层生成的特征图x’;(5)计算x与x’的特征图差值;(6)遍历所有n个过滤器之后,将n个过滤器按照x与x’的特征图差值进行排序;(7)选取所述特征图差值最小的m个过滤器作为移除掉的过滤器。
优选地,k=2。
优选地,所述的x与x’的特征图差值是x与x’的特征图差值的L2范数,记为。
根据本发明的第二方面,提供一种在卷积神经网络中通过对卷积层中的过滤器剪枝进行网络敏感度分析的方法,包括:对于原始网络模型,使用验证数据集测试其精度;遍历网络中除最后k个卷积层之外的所有卷积层,其中k为任意正整数;对当前遍历到的卷积层运行根据本发明第一方面所述的在卷积神经网络中基于特征图变化对卷积层中的过滤器进行剪枝的方法中的步骤(1)至(6);从所述差值最小的过滤器开始依次移除每个过滤器,其中,每移除掉一个过滤器,就对剪枝后的网络精度进行测试,直到剩余最后一个过滤器,得到网络精度测试结果;将当前卷积层移除掉的过滤器全部恢复,保持与原始网络相同;将所述网络精度测试结果与原始网络精度做差值,得到精度差值,该精度差值表明了移除相应个数的过滤器后网络精度的损失情况,精度损失越大,说明该层对过滤器移除的敏感度越高。
根据本发明的第三方面,提供一种在卷积神经网络中基于敏感度对网络进行剪枝的方法,包括:执行根据本发明第二方面所述的在卷积神经网络中通过对卷积层中的过滤器剪枝进行网络敏感度分析的方法;设定剪枝后所能接受的模型精度损失阈值;遍历网络中除最后k个卷积层之外的所有卷积层,其中k为任意正整数,根据当前遍历到的卷积层的敏感度结果,确定在不超过所述模型精度损失阈值情况下该层所能移除的最大过滤器个数m;移除掉该层按照所述特征图差值排序的最小的m个过滤器;遍历网络中除最后k个卷积层之外的所有卷积层后完成对这些层的剪枝。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深鉴智能科技有限公司,未经北京深鉴智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711011383.2/2.html,转载请声明来源钻瓜专利网。





