[发明专利]基于现场可编程门阵列的卷积神经网络加速系统在审

申请号：	201810497946.1	申请日：	2018-05-22
公开（公告）号：	CN108665059A	公开（公告）日：	2018-10-16
发明（设计）人：	李曦;周学海;王超;孙凡;万波	申请（专利权）人：	中国科学技术大学苏州研究院
主分类号：	G06N3/04	分类号：	G06N3/04
代理公司：	苏州创元专利商标事务所有限公司 32103	代理人：	范晴
地址：	215123 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于现场可编程门阵列的卷积神经网络加速系统，所述加速系统包括通用处理器、现场可编程门阵列、存储模块以及数据总线和控制总线，其中，通用处理器是一个精简指令集的软核，它负责启动加速器、与主机端进行通信以及时间测量等；DDR3 DRAM作为加速器系统的外部存储器；AXI4‑Lite 总线用于命令传输，AXI4 总线用于数据传输；现场可编程门阵列中包含有多个处理引擎(PE)，每一个处理引擎都使用了最合适的分片展开策略来与卷积神经网络中一层的计算对应；所有的处理引擎都映射到同一块FPGA芯片上，这样不同的层能够以流水线的方式同时工作。本发明相对于已有的卷积神经网络加速系统能够取得更高的能效收益。
搜索关键词：	现场可编程门阵列卷积神经网络加速系统处理引擎通用处理器总线加速器系统精简指令集外部存储器存储模块控制总线命令传输时间测量数据传输数据总线主机端加速器映射能效软核流水线收益通信
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于现场可编程门阵列的卷积神经网络加速系统，其特征在于，包括：通用处理器，与现场可编程门阵列进行通信；存储模块，用于通用处理器与现场可编程门阵列的数据交互；现场可编程门阵列，用于加速卷积神经网络的计算过程；还包括统一的编程接口，供用户调用所述加速系统完成相应的任务；整个加速系统的执行过程分为以下几步：S1：通用处理器端通过提供的编程接口选择合适的加速器，并把计算过程中需要使用的输入数据和权值数据写入存储器中；S2：现场可编程门阵列中的加速器从存储器中读取输入数据和权值数据并开始计算，并把最后的计算结果写入存储器中；S3：通用处理器从存储器中读取计算完成以后的结果输出到屏幕。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学苏州研究院，未经中国科学技术大学苏州研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810497946.1/，转载请声明来源钻瓜专利网。

上一篇：一种基于分段损失的生成对抗网络方法
下一篇：一种用于计算光刻的集成神经网络

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于现场可编程门阵列的卷积神经网络加速系统在审

专利文献下载