[发明专利]一种基于脉动阵列的稀疏神经网络计算方法及装置有效
申请号: | 202011013121.1 | 申请日: | 2020-09-24 |
公开(公告)号: | CN111931919B | 公开(公告)日: | 2021-04-27 |
发明(设计)人: | 陶为;王中风;刘文剑;谢逍茹 | 申请(专利权)人: | 南京风兴科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 210032 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 脉动 阵列 稀疏 神经网络 计算方法 装置 | ||
本申请公开了一种基于脉动阵列的稀疏神经网络计算方法,包括获取包含n个权值的特征图;所述特征图的尺寸为x*y;将所述特征图沿x轴方向平均分割成n个子特征块,每个所述子特征块的尺寸为(x/n)*y;每个子特征块对应一个所述权值;根据所述权值在权值矩阵中的位置对每个子特征块进行计算,得到计算结果;根据所述计算结果重新生成权值矩阵并输出。本申请通过脉动阵列的方式实现稀疏卷积计算,使得数据复用更加充分,以分块的方式进行卷积,计算更加灵活且效率更高,权值经过编码后再输入至下级设备,仅有非零的权值被输入到架构进行计算,减少了编码单元的损耗。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于脉动阵列的稀疏神经网络计算方法及装置。
背景技术
随着人工智能(AI)的不断发展,它已经从早期的人工特征工程进化到如今可以从海量数据中完成学习,并且能够应用到机器视觉、语音识别以及自然语言处理等多个领域。卷积神经网络(Convolutional Neural Network,CNN)是深度学习技术中极具代表性的网络结构之一,其在人工智能领域受到越来越多的青睐,尤其在图像处理领域取得了显著的效果。
随着网络覆盖面越来越广、越来越复杂,用于卷积训练的计算资源也成倍地增长,对于具有更多层和节点的神经网络,减少其存储和计算成本变得至关重要。现有技术表明,卷积层占据了大约90-95%的计算时间和参数规模,且具有较大的值;全连接层占据了大约5-10%的计算时间,95%的参数规模,且值较小。因此,采用网络剪枝和共享等方式对深度模型进行压缩与加速是在保证网络照常工作前提下节省运行参数、计算时间的必要手段。
现有技术中的剪枝方法比较常用的是预先训练的CNN模型中修剪冗余的、非信息量的权重,在稀疏性限制的情况下培训紧凑的CNN是目前主流的方法,这些稀疏约束通常作为l_0或l_1范数调节器在优化问题中引入。例如,可采用Combricon-X架构用于处理稀疏权值的CNN计算,在架构中的控制单元Buffer Controller中将数值为0的权值除去,传输给相应的计算单元,由计算单元执行乘加操作。然而,这种架构输入的数据中包含权值为零的数据,导致将权值全部输入后,需要从所有权值中将数值为零的权值先除去,再选取非零权值进行编码,不仅严重减低计算效率,还大量耗费了系统资源。
发明内容
本申请提供了一种基于脉动阵列的稀疏神经网络计算方法,以解决现有技术中存在的加密、解密过程效率低、资源消耗大的问题。
第一方面,本申请提供了一种基于脉动阵列架构的稀疏神经网络计算方法,包括:
获取包含n个权值的特征图;所述特征图的尺寸为x*y;
将所述特征图沿x轴方向平均分割成n个子特征块,每个所述子特征块的尺寸为(x/n)*y;每个子特征块对应一个所述权值;
根据所述权值在权值矩阵中的位置对每个子特征块进行计算,得到计算结果;
根据所述计算结果重新生成权值矩阵并输出。
在一些实施例中,所述将所述特征图沿x轴方向平均分割成n个子特征块的步骤包括:
获取输入通道并行数及步长值;
以所述并行数记为组、所述步长值记为输出通道,将所述特征图划分为n个子特征块。
在一些实施例中,所述根据所述权值在权值矩阵中的位置对每个子特征块进行计算包括:
获取当前子特征块对应的权值在权值矩阵中的位置;
若当前权值为权值矩阵中的第一个权值,或者当前权值所在位置与上一权值所在位置相同,则计算当前权值矩阵中的部分和;
将权值、子特征块及所述部分和进行乘法操作,得到计算结果。
在一些实施例中,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京风兴科技有限公司,未经南京风兴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011013121.1/2.html,转载请声明来源钻瓜专利网。