[发明专利]用于加速神经网络处理器的方法和系统及神经网络处理器在审
申请号: | 201710777737.8 | 申请日: | 2017-09-01 |
公开(公告)号: | CN107491811A | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 韩银和;许浩博;王颖 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇,苏晓丽 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 加速 神经网络 处理器 方法 系统 | ||
1.一种用于加速神经网络处理器的方法,所述方法包括:
步骤1)从待处理的神经网络模型的原始数据和权重中提取非零元素及其相对位置,并分别加载至神经网络处理器的数据存储单元和权重存储单元;
步骤2)对来自所述权重存储单元的权重和来自数据存储单元的数据进行匹配,仅将相对位置相同的权重和数据加载至神经网络处理器的计算单元参与运算。
2.根据权利要求1所述的方法,还包括从来自神经网络处理器的计算单元的输出数据中提取非零元素及其相对位置,并将其保存到数据存储单元。
3.一种神经网络处理器,包括控制单元、计算单元、权重存储单元、数据存储单元,数据匹配单元,其中控制单元用于控制相关数据的调度、运算与存储;权重存储单元存储已经训练好的神经网络权重中非零元素及其相对位置;数据存储单元存储神经网络原始数据及中间结果数据中非零元素及其相对位置;数据匹配单元用于对来自所述权重存储单元的权重和来自数据存储单元的数据进行匹配,仅将相对位置相同的权重和数据加载至计算单元中。
4.根据权利要求3所述的神经网络处理器,还包括数据压缩单元,用于从来自计算单元的输出数据中提取非零元素及其相对位置,并将其保存到数据存储单元。
5.根据权利要求3所述的神经网络处理器,其中数据匹配单元包含在各个计算单元中。
6.根据权利要求5所述的神经网络处理器,其中各个计算单元并行工作,控制单元调度不同的权重值接入不同的计算单元,并控制来自数据存储单元的数据由各个计算单元共享,每个计算单元中相应的数据匹配单元对于输入的数据和权重进行匹配以判断是否对其进行运算。
7.根据权利要求3-6所述的神经网络处理器,其中数据匹配单元包括一个或多个比较器。
8.根据权利要求3-56中任一项所述的神经网络处理器,其中数据压缩单元包括输入寄存器、输出寄存器和比较器,输入寄存器接收来自计算单元的数据,通过比较器判断该数据是否为零值,如果不为零则将该数据及对应的寄存器编号载入至输出寄存器中。
9.一种用于加速神经网络处理器的系统,所述系统包括:
数据预处理装置,用于从待处理的神经网络模型的原始数据和权重中提取非零元素及其相对位置,并分别加载至神经网络处理器的数据存储单元和权重存储单元;
数据匹配装置,对来自所述权重存储单元的权重和来自数据存储单元的数据进行匹配,仅将相对位置相同的权重和数据加载至神经网络处理器的计算单元参与运算。
10.根据权利要求9所述的系统,还包括:
数据压缩装置,对于来自神经网络处理器的计算单元的输出数据中提取非零元素及其相对位置,并将其保存到神经网络处理器的数据存储单元中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710777737.8/1.html,转载请声明来源钻瓜专利网。