[发明专利]一种可重构神经网络算法的加速装置及方法在审
| 申请号: | 201811641086.0 | 申请日: | 2018-12-29 |
| 公开(公告)号: | CN109472356A | 公开(公告)日: | 2019-03-15 |
| 发明(设计)人: | 李丽;陈沁雨;何书专;曹华锋 | 申请(专利权)人: | 南京宁麒智能计算芯片研究院有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063 |
| 代理公司: | 江苏瑞途律师事务所 32346 | 代理人: | 金龙 |
| 地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络算法 加速装置 可重构 算法 可重构硬件 重构控制器 资源利用率 固定配置 加速性能 降低功耗 结构网络 配置信息 数据通路 芯片设计 运算过程 最优性能 吞吐率 加速器 灵活 映射 重构 运算 优化 网络 分析 | ||
1.一种可重构神经网络算法的加速装置,其特征在于:包括存储器模块、存储控制器模块,存储控制器模块对存储器模块进行控制,并通过总线接口模块与DMA模块传输信息;总线接口模块与调度器模块连接,调度器模块与DMA模块互相连接,DMA模块与SRAM传送数据,SRAM通过SRAM控制器模块进行控制,Memory Switch模块与SRAM控制器模块控制运算单元与SRAM控制器模块进行交互;重构控制器模块,对运算单元进行控制,通过配置信息对神经网络算法重构特定数据通路,并控制神经网络算法在运算单元的运算。
2.根据权利要求1所述的一种可重构神经网络算法的加速装置,其特征在于:所述的计算单元由超越计算单元和脉动阵列组成,其中超越计算单元由若干exp函数组成,用于非线性激活函数的实现。
3.根据权利要求2所述的一种可重构神经网络算法的加速装置,其特征在于:所述的脉动阵列中包括n*n个NCU,n为不小于8的自然数。
4.根据权利要求3所述的一种可重构神经网络算法的加速装置,其特征在于:脉动阵列中包括32*32个NCU。
5.根据权利要求3或4所述的一种可重构神经网络算法的加速装置,其特征在于:每个NCU包括一个乘法器、一个加法器及若干寄存器组成,数据经由乘法器相乘,得出的结果送入加法器中进行累加,寄存器主要用于存放累加过程中的部分和、源数据1、2和本地结果。
6.根据权利要求5所述的一种可重构神经网络算法的加速装置,其特征在于:脉动阵列的接口为:32个源数据1输入接口、32个源数据2输入接口、1个设定乘累加计算长度的输入接口、1个输入数据有效信号的输入接口、1个激活函数选择信号的输入接口、32个结果数据的输出接口、1个结果输出有效信号的输出接口。
7.根据权利要求1所述的一种可重构神经网络算法的加速装置,其特征在于:SRAM控制模块用于在Memory Switch模块功能完成后,控制神经网络算法源数据1、2和结果数据在DMA和SRAM之间的传输。
8.一种可重构神经网络算法的加速方法,其特征在于:采用权利要求1-6任一所述的加速装置,指令通过总线接口传入到调度器中进行解码,数据通路根据配置信息重构,数据从存储器由DMA模块传输至SRAM,运算单元阵列从SRAM中读取数据进行计算,结果存回SRAM中,最后再通过DMA模块传输回存储器。
9.根据权利要求8所述的一种可重构神经网络算法的加速方法,其特征在于:所述的运算单元阵列对神经网络算法拆分为若干卷积运算、矩阵乘法以及非线性计算,对神经网络算法进行重构映射。
10.根据权利要求8或9所述的一种可重构神经网络算法的加速方法,其特征在于:所述的脉动阵列的脉动方式为,从上往下广播源数据1,从左到右传播源数据2,结果在阵列中各个NCU本地产生。从阵列右端的32个结果数据接口依次输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京宁麒智能计算芯片研究院有限公司,未经南京宁麒智能计算芯片研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811641086.0/1.html,转载请声明来源钻瓜专利网。





