[发明专利]基于现场可编程门阵列的卷积神经网络加速系统在审
申请号: | 201810497946.1 | 申请日: | 2018-05-22 |
公开(公告)号: | CN108665059A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 李曦;周学海;王超;孙凡;万波 | 申请(专利权)人: | 中国科学技术大学苏州研究院 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 范晴 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于现场可编程门阵列的卷积神经网络加速系统,所述加速系统包括通用处理器、现场可编程门阵列、存储模块以及数据总线和控制总线,其中,通用处理器是一个精简指令集的软核,它负责启动加速器、与主机端进行通信以及时间测量等;DDR3 DRAM作为加速器系统的外部存储器;AXI4‑Lite 总线用于命令传输,AXI4 总线用于数据传输;现场可编程门阵列中包含有多个处理引擎(PE),每一个处理引擎都使用了最合适的分片展开策略来与卷积神经网络中一层的计算对应;所有的处理引擎都映射到同一块FPGA芯片上,这样不同的层能够以流水线的方式同时工作。本发明相对于已有的卷积神经网络加速系统能够取得更高的能效收益。 | ||
搜索关键词: | 现场可编程门阵列 卷积神经网络 加速系统 处理引擎 通用处理器 总线 加速器系统 精简指令集 外部存储器 存储模块 控制总线 命令传输 时间测量 数据传输 数据总线 主机端 加速器 映射 能效 软核 流水线 收益 通信 | ||
【主权项】:
1.基于现场可编程门阵列的卷积神经网络加速系统,其特征在于,包括:通用处理器,与现场可编程门阵列进行通信;存储模块,用于通用处理器与现场可编程门阵列的数据交互;现场可编程门阵列,用于加速卷积神经网络的计算过程;还包括统一的编程接口,供用户调用所述加速系统完成相应的任务;整个加速系统的执行过程分为以下几步:S1:通用处理器端通过提供的编程接口选择合适的加速器,并把计算过程中需要使用的输入数据和权值数据写入存储器中;S2:现场可编程门阵列中的加速器从存储器中读取输入数据和权值数据并开始计算,并把最后的计算结果写入存储器中;S3:通用处理器从存储器中读取计算完成以后的结果输出到屏幕。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学苏州研究院,未经中国科学技术大学苏州研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810497946.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于分段损失的生成对抗网络方法
- 下一篇:一种用于计算光刻的集成神经网络