[发明专利]卷积神经网络训练8位张量表示方法及系统在审

专利信息
申请号: 202211200169.2 申请日: 2022-09-29
公开(公告)号: CN115438775A 公开(公告)日: 2022-12-06
发明(设计)人: 王琴;张卓健;蒋剑飞;景乃锋;绳伟光 申请(专利权)人: 上海交通大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 胡晶
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 卷积 神经网络 训练 张量 表示 方法 系统
【说明书】:

本发明提供了一种卷积神经网络训练8位张量表示方法及系统,包括:步骤S1:张量分成低比特张量部分和共享阶码数组;步骤S2:使用SP8表示方法表示低比特张量部分的数值;步骤S3:使用按通道分配共享阶码的共享阶码管理方法共享阶码部分;步骤S4:将张量表示方法应用于卷积神经网络训练时卷积部分的前向传播与反向传播。本发明有效降低卷积神经网络训练时的存储开销与计算开销;本发明具有比现有8位张量表示方法更高的神经网络训练精度。

技术领域

本发明涉及人工智能领域,具体地,涉及一种卷积神经网络训练8位张量表示方法及系统。

背景技术

神经网络技术是人工智能的一个重要分支,而神经网络种类较多,有卷积神经网络(CNN)、循环神经网络(RNN)、脉冲神经网络(SNN)等。其中,卷积神经网络由于其权重共享、提取区域特征等特性在图像分类、目标检测、语义分割等应用领域有着重要的地位。

卷积神经网络的训练由多个周期组成,每个周期可以分成三个主要步骤:前向传播、反向传播与权重更新。前向传播时卷积层神经网络的卷积层会根据输入激活(inputactivation)与权重(weight)进行卷积运算得到输出激活(output activation)。反向传播时卷积层会根据输入激活与输出激活梯度(output activation gradient)卷积得到权重梯度(weight gradient),并通过转置后的权重与输出激活梯度卷积得到输入激活梯度(input activation gradient)。权重更新即通过反向传播时得到的权重梯度基于一定的梯度下降算法去更新神经网络的权重。

神经网络的训练通常使用单精度浮点数(single-precision floating-pointformat)作为运算时的数值表示方法,它由1比特符号位8比特阶码位和23比特尾数位总共32位组成。现阶段有用更低比特位的数值表示方法应用于卷积神经网络训练,但一般只将低比特数值表示方法应用于训练时卷积层的前向传播与反向传播,因为其他层级如归一化层可能有更高的精度需求,权重更新阶段也有着高精度需求。

卷积神经网络的训练是一个计算密集型与存储密集型的任务,需要上亿级的浮点操作与千兆字节的存储。通过对训练时张量(tensor)进行低比特表示可以显著减少训练的存储需求与计算需求,通常为了将张量进行低比特表示需要辅助方法如共享阶码(sharedexponent)与损失缩放(loss scaling)将张量转换到低比特数值表示方法可以表示的数值范围,但将张量进行低比特表示也往往会对卷积神经网络训练的精度有所影响。

针对这些技术挑战,本文提出了按通道分配共享阶码,并由1比特符号位1比特以4为底的阶码位和6比特尾数位组成的8位张量表示方法。

专利文献CN111340186A(申请号:CN202010095808.8)公开了一种基于张量分解的压缩表示学习方法,该方法首先将通过一个微型神经网络预处理学习到的表示转化为一个待分解的张量,基于优化算法进行张量分解,求解其子空间并进行低秩重建,最后经过另一个微型神经网络加工张量分解抽取的低秩表示,融合到主干网络学习的表示中,起到正则的作用;并结合截断的单步梯度优化方法,用于改进具有多步沿时间轴迭代模型的优化算法。但该发明神经网络训练精度不足。

发明内容

针对现有技术中的缺陷,本发明的目的是提供一种卷积神经网络训练8位张量表示方法及系统。

根据本发明提供的一种卷积神经网络训练8位张量表示方法,包括:

步骤S1:卷积神经网络训练中,将张量分成低比特张量部分和共享阶码数组;

步骤S2:使用SP8表示方法表示低比特张量部分的数值;

步骤S3:使用按通道分配共享阶码的共享阶码管理方法共享阶码部分;

步骤S4:将张量表示方法应用于卷积神经网络训练时卷积部分的前向传播与反向传播。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211200169.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top