[发明专利]一种兼容型神经网络加速器及数据处理方法有效
| 申请号: | 201810244109.8 | 申请日: | 2018-03-23 |
| 公开(公告)号: | CN108734270B | 公开(公告)日: | 2020-11-10 |
| 发明(设计)人: | 韩银和;闵丰;许浩博;王颖 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 兼容 神经网络 加速器 数据处理 方法 | ||
1.一种兼容型神经网络加速器,包括存储单元、矩阵运算单元、模式运算单元、激活单元以及控制单元,其中,
所述存储单元用于存储神经元数据、权值数据及控制指令并输出;所述存储单元包括指令存储模块、权值存储模块、权值缓存模块、数据存储模块、数据缓存模块;所述存储单元的各个模块分别与DMA总线连接;权值缓存模块和数据缓存模块分别与总线连接;
所述矩阵运算单元与所述总线连接,用于根据所述控制指令从所述存储单元接收数据并针对所述接收的数据执行矩阵运算并输出运算结果;
所述模式运算单元包括多个功能模块,所述功能模块可用于从所述矩阵运算单元和/所述激活单元和/或所述存储单元或接收数据,并根据所述控制指令针对所述接收的数据执行与网络对应的特定运算并输出运算结果;所述功能模块包括用于执行部分加操作的累加模块、用于执行向量平行乘法和累加运算的向量平行乘累加模块、用于执行向量取反或减法的多功能运算模块和执行池化操作的池化模块;所述模式运算单元的各个所述功能模块分别与所述总线连接;
所述激活单元与所述总线连接,用于从所述模式运算单元和/或所述存储单元接收数据,并针对所述接收的数据执行激活操作并输出激活结果;
控制单元,对神经网络加速器接收的神经网络参数进行分析,确定相应的网络计算模式并切换,通过所述总线调用该相应模式下的功能模块,根据分析神经网络参数获得的数据处理指令对相应的功能模块进行初始化以及指令加载,控制所述存储单元、所述矩阵运算单元、所述激活单元以及所述模式运算单元执行针对特定神经网络的运算;所述控制单元分别与所述DMA总线和所述总线连接;所述特定神经网络是LSTM网络及其变异体网络或者CNN,若所述神经网络是LSTM网络及其变异体,所述控制单元将调用所述模式运算单元中的累加模块、向量平行乘累加模块以及多功能运算模块中的若干模块进行运算,若所述神经网络是CNN,所述控制单元将调用所述模式运算单元中的池化模块进行运算。
2.根据权利要求1所述的神经网络加速器,其特征在于,矩阵运算单元包括用于执行向量乘法结果相互累加运算的相互累加运算模块和用于执行多组向量乘法结果平行自累加运算的自累加运算模块。
3.一种利用如权利要求1或2所述的神经网络加速器进行数据处理的方法,包括以下步骤:
接收并分析神经网络参数,确定计算模式;
根据所述计算模式调用矩阵运算单元、激活单元和相应的功能模块;
利用所述调用的单元及模块执行相应运算并输出计算结果。
4.根据权利要求3所述的数据处理方法,其特征在于,若所述计算模式为LSTM网络计算模式,可利用所述功能模块执行与LSTM或LSTM变异体模型相关的运算。
5.根据权利要求3所述的数据处理方法,其特征在于,若所述计算模式为CNN计算模式,可利用所述功能模块执行池化运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810244109.8/1.html,转载请声明来源钻瓜专利网。





