[发明专利]一种粗粒度可重构的卷积神经网络加速器及系统有效
申请号: | 201710104029.8 | 申请日: | 2017-02-24 |
公开(公告)号: | CN106951961B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 袁哲;刘勇攀;杨华中;岳金山;李金阳 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06T1/20;G06T1/60 |
代理公司: | 11002 北京路浩知识产权代理有限公司 | 代理人: | 汤财宝<国际申请>=<国际公布>=<进入 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 粒度 可重构 卷积 神经网络 加速器 系统 | ||
1.一种粗粒度可重构的卷积神经网络加速器,其特征在于,包括多个处理单元簇,所述每个处理单元簇包括若干基本计算单元,所述若干基本计算单元通过一子加法单元连接,所述多个处理单元簇的子加法单元分别连接到一母加法单元;所述每个子加法单元用于产生相邻的若干基本加法单元的部分和,所述母加法单元用于累加所述子加法单元;所述处理单元簇为4个,所述4个处理单元簇呈正交矩阵排布;所述每个处理单元簇包括4个基本计算单元,所述4个基本计算单元呈正交矩阵排布。
2.根据权利要求1所述的粗粒度可重构的卷积神经网络加速器,其特征在于,所述基本计算单元包括3×3卷积单元。
3.根据权利要求2所述的粗粒度可重构的卷积神经网络加速器,其特征在于,所述每个基本计算单元包括9个呈九宫格排布的乘法器,还包括1个加法器,同一列上的3个所述乘法器的输入寄存器为位移寄存器。
4.根据权利要求1所述的粗粒度可重构的卷积神经网络加速器,其特征在于,所述每个处理单元簇矩阵每行中相邻的基本计算单元通过权重互联单元连接权重轨道,每列中相邻两个基本计算单元通过图像互联单元连接图像轨道;
所述权重互联单元用于给每个基本计算单元连接权重轨道,通过SRAM控制选择,从权重轨道中选出权重数据给每个基本计算单元;
所述图像互联单元用于连接基本计算单元与图像轨道,在SRAM的控制下从图像轨道和上一个基本计算单元的输出集合中选出3个连续的数据。
5.根据权利要求3所述的粗粒度可重构的卷积神经网络加速器,其特征在于,所述每个处理单元簇中乘法器和加法器在不用时关闭,所述子加法单元和母加法单元在不用时断电。
6.一种粗粒度可重构的卷积神经网络加速系统,其特征在于,包括若干并行的如权利要求1至5任一所述的卷积神经网络加速器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710104029.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高炉冶炼钢包自动烘烤装置
- 下一篇:一种铸铜中间包砌筑模板结构