[发明专利]深度可分离卷积结构的低比特量化方法有效
申请号: | 201910931215.8 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110659734B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 吴绮;李志远;陈刚;鲁华祥;边昳 | 申请(专利权)人: | 中国科学院半导体研究所 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吴梦圆 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 可分离 卷积 结构 比特 量化 方法 | ||
1.一种深度可分离卷积结构的低比特量化方法,其特征在于,该方法包括:
选择量化系数对训练结束的深度可分离卷积神经网络的权重和特征图数据进行均匀量化,使得量化前后权重和特征图数据的最小均方误差最小;
对训练结束的深度可分离卷积神经网络中的权重进行逐通道量化;
输入图片,在训练结束的深度可分离卷积神经网络中进行前向运算,得到深度可分离卷积神经网络的特征图数据,并利用特征图数据对深度可分离卷积神经网络进行逐层量化;
基于训练集在训练结束的深度可分离卷积神经网络中进行前向运算,并对批量归一化层中的滑动平均参数进行更新;以及
将更新后的批量归一化层中的滑动平均参数和可学习的参数融合到网络权重量化系数和偏置中,实现深度可分离卷积结构的低比特量化。
2.根据权利要求1所述的深度可分离卷积结构的低比特量化方法,其特征在于,所述选择量化系数对训练结束的深度可分离卷积神经网络的权重和特征图数据进行均匀量化,使得量化前后权重和特征图数据的最小均方误差最小,包括:
根据训练结束的深度可分离卷积神经网络中的权重x、特征图数据分布和网络量化位数n,均匀构造量化系数表,构造方式为将数据绝对值的最大值均匀分为m份,第i个量化系数值si为:
假如训练结束的深度可分离卷积神经网络中的权重x、特征图数据非负,将这m个量化系数作为最终的量化系数表,否则,将m个量化系数的负值也加入表中作为最终的量化系数表;
基于构造的量化系数表,分别对训练结束的深度可分离卷积神经网络中的权重、特征图数据进行均匀量化,求解量化前后数据均方误差,并将最小均方误差对应的量化系数作为最终的量化系数。
3.根据权利要求2所述的深度可分离卷积结构的低比特量化方法,其特征在于,所述对训练结束的深度可分离卷积神经网络中的权重、特征图数据进行均匀量化包括:
首先将原始的训练结束的深度可分离卷积神经网络中的权重、特征图数据除以量化系数并取整,取整方式为四舍五入,
其中,s表示量化系数,x表示训练结束的深度可分离卷积神经网络中的权重、特征图数据,y为计算的中间变量;
对量化后的深度可分离卷积神经网络中的权重、特征图数据根据网络量化位数进行截断,假如量化后的数据非负,截断方式为:
z=max(min(y,2n-1-1),0)
否则,截断方式为,
z=max(min(y,2n-1-1),-2n-1)
其中,z为计算的中间变量,n表示网络量化位数;
最后将截断后的数据乘以量化系数s作为原始数据的近似值:
xq=s*z
其中,xq表示原始数据的近似值。
4.根据权利要求1所述的深度可分离卷积结构的低比特量化方法,其特征在于,所述对训练结束的深度可分离卷积神经网络中的权重进行逐通道量化,包括:
将训练结束的深度可分离卷积神经网络中的四维权重张量按照输出通道分组;
利用一维线性搜索算法,对每个通道的三维权重张量分别选择量化系数;以及
利用上述量化系数,分别对每个通道的三维权重张量进行量化,并将量化系数和量化过程中截断后的n位整数存储下来。
5.根据权利要求1所述的深度可分离卷积结构的低比特量化方法,其特征在于,所述输入图片,在训练结束的深度可分离卷积神经网络中进行前向运算,得到深度可分离卷积神经网络的特征图数据,并利用特征图数据对深度可分离卷积神经网络进行逐层量化,包括:
将数据集中的图片按照网络输入要求进行处理并送入深度可分离卷积神经网络的输入端,进行深度可分离卷积神经网络的前向计算,得到深度可分离卷积神经网络中每一层输出特征图数据;以及
利用一维线性搜索算法,对深度可分离卷积神经网络中每一层特征图数据分别选择量化系数,并将量化系数存储下来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院半导体研究所,未经中国科学院半导体研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910931215.8/1.html,转载请声明来源钻瓜专利网。