[发明专利]一种粗粒度可重构的卷积神经网络加速器及系统有效
申请号: | 201710104029.8 | 申请日: | 2017-02-24 |
公开(公告)号: | CN106951961B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 袁哲;刘勇攀;杨华中;岳金山;李金阳 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06T1/20;G06T1/60 |
代理公司: | 11002 北京路浩知识产权代理有限公司 | 代理人: | 汤财宝<国际申请>=<国际公布>=<进入 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种粗粒度可重构的卷积神经网络加速器及系统,所述加速器包括多个处理单元簇,所述每个处理单元簇包括若干基本计算单元,所述若干基本计算单元通过一子加法单元连接,所述多个处理单元簇的子加法单元分别连接到一母加法单元;所述每个子加法单元用于产生相邻的若干基本加法单元的部分和,所述母加法单元用于累加所述子加法单元。本发明采用粗粒度可重配的方式,通过SRAM或其他互联单元链接不同的权重与图像轨道,以实现不同的卷积核处理结构,可以高效的支持不同大小的网络和卷积核,同时大量减少重新配置的开销。 | ||
搜索关键词: | 一种 粒度 可重构 卷积 神经网络 加速器 系统 | ||
【主权项】:
1.一种粗粒度可重构的卷积神经网络加速器,其特征在于,包括多个处理单元簇,所述每个处理单元簇包括若干基本计算单元,所述若干基本计算单元通过一子加法单元连接,所述多个处理单元簇的子加法单元分别连接到一母加法单元;所述每个子加法单元用于产生相邻的若干基本加法单元的部分和,所述母加法单元用于累加所述子加法单元;所述处理单元簇为4个,所述4个处理单元簇呈正交矩阵排布;所述每个处理单元簇包括4个基本计算单元,所述4个基本计算单元呈正交矩阵排布。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710104029.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种高炉冶炼钢包自动烘烤装置
- 下一篇:一种铸铜中间包砌筑模板结构