[发明专利]一种基于空间正反对角卷积的神经网络压缩方法有效

专利信息
申请号: 201910089080.5 申请日: 2019-01-30
公开(公告)号: CN109886391B 公开(公告)日: 2023-04-28
发明(设计)人: 张萌;沈旭照;李国庆;李建军;刘文昭;郭晟昊 申请(专利权)人: 东南大学
主分类号: G06N3/0464 分类号: G06N3/0464;G06N3/0495;G06N3/082
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 214000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 空间 正反 对角 卷积 神经网络 压缩 方法
【说明书】:

发明公开了一种基于空间正反对角卷积的神经网络压缩方法,对许多场景而言,卷积神经网络是目前计算机视觉和数字图像处理解决方案的核心,但卷积神经网络的计算复杂度和参数数量仍然是各种应用场景的限制因素。为了提高卷积神经网络的计算效率,减少网络的参数个数,本发明在空间上,将一对连续的传统方形卷积核替换为正反对角卷积核,先进行正对角卷积操作,然后经过批归一化和非线性函数激活处理后,再进行反对角卷积操作,在保留了更有效的局部感受中心的前提下进一步降低了卷积神经网络的计算复杂度,加快了网络传播速度,同时对角卷积具有一定的正则化效果,提高了网络的鲁棒性,降低了模型的过拟合,网络压缩后的整体效果提升明显。

技术领域

本发明涉及一种神经网络裁剪及卷积分解技术,属于数字图像处理技术领域。

背景技术

近年来,深度学习在解决高层次抽象认知问题上有着显著的成果,卷积神经网络是深度学习的最为重要的工具之一,它的权值共享网络使之更类似生物神经网络结构,减少了权重数量,降低了模型的规模。卷积神经网络对图像的平移,缩放,旋转等形式的变形具有高度的适应性,在图像识别和目标检测等领域应用广泛,如微软利用卷积神经网络做阿拉伯文和中文的手写识别系统,谷歌使用卷积神经网络来识别街景图片中的人脸和车牌等等。

卷积神经网络最初包含了卷积层和池化层这两种结构。卷积层中的卷积单元作为特征的识别器,图片像素之间的关联是局部的,类似人眼是通过视神经分别去感知小图像块,不需要每一个神经元对整幅图片做感知,因此每个卷积核有一个输出,在大脑中综合判断后,得到整幅图片的特征。权值共享是卷积神经网络的一个特征,位于图片底层的特征是普遍适用的,与位置无关,比如图像边沿,无论是位于图像上方还是在图像下方的局部区域边沿特征,都可以用类似的特征提取器,这样,一幅图像中局部区域的一个特征只需要一个卷积核就能提取。对于主要用于提取底层特征的前几层网络,权值共享进一步减少了参数的个数,在卷积层识别特征的同时,池化采样可以把那些细小特征归并为一,因为这些位置接近的区域相互之间经常包含一些微妙的联系,池化采样可以把这些细小的特征集合起来,也正是因为卷积神经网络结构的独特性,使得它在图像识别领域得到了广泛的应用。

卷积神经网络在充分保留图像特征的同时,减少了网络的参数数量,降低了网络规模,但卷积神经网络的计算复杂度和参数数量仍然是许多应用场景的限制因素,特别是在移动端使用时,一次前向传播要消耗巨大的计算资源,耗费较长的时间,不利于部署在实时性处理要求高的应用上。

Yann Le Cun等在《Optimal brain damage》(Advances in Neural InformationProcessing Systems(NIPS),1990:598–605)提出神经网络的参数众多,但其中有些参数对最终的输出结果贡献不大而显得冗余,需要根据对最终输出结果的贡献大小来对模型神经元进行排序,舍去那些贡献度低的神经元,使模型运行速度更快,参数更少;Han Song等在《Deep compression:Compressing deep neural networks with pruning,trainedquantization andhuffman coding》(International Conference on LearningRepresentations(ICLR),2016)使用剪枝,在所有连接中,移除权重小于一定阈值的连接,然后重新训练网络,通过此方法将Alexnet和VGG-16模型的参数分别减少了9倍和13倍;但是上述两种方法都需要一个不断迭代的过程,即模型剪枝和网络训练两者交替重复。

Szegedy C等在《Rethinking the inception architecture for computervision》(Proceeding ofthe IEEE conference on computer vision and patternrecognition,2016:2818-2826)中将传统卷积空间分解为不对称卷积,通过1*n卷积和后面接着一个n*1卷积替换任何n*n卷积,参数数量明显减少,但这种分解方法在网络的前面几层不能很好的工作,只对于中间层的效果明显。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910089080.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top