[发明专利]基于现场可编程门阵列的卷积神经网络加速系统在审

专利信息
申请号: 201810497946.1 申请日: 2018-05-22
公开(公告)号: CN108665059A 公开(公告)日: 2018-10-16
发明(设计)人: 李曦;周学海;王超;孙凡;万波 申请(专利权)人: 中国科学技术大学苏州研究院
主分类号: G06N3/04 分类号: G06N3/04
代理公司: 苏州创元专利商标事务所有限公司 32103 代理人: 范晴
地址: 215123 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于现场可编程门阵列的卷积神经网络加速系统,所述加速系统包括通用处理器、现场可编程门阵列、存储模块以及数据总线和控制总线,其中,通用处理器是一个精简指令集的软核,它负责启动加速器、与主机端进行通信以及时间测量等;DDR3 DRAM作为加速器系统的外部存储器;AXI4‑Lite 总线用于命令传输,AXI4 总线用于数据传输;现场可编程门阵列中包含有多个处理引擎(PE),每一个处理引擎都使用了最合适的分片展开策略来与卷积神经网络中一层的计算对应;所有的处理引擎都映射到同一块FPGA芯片上,这样不同的层能够以流水线的方式同时工作。本发明相对于已有的卷积神经网络加速系统能够取得更高的能效收益。
搜索关键词: 现场可编程门阵列 卷积神经网络 加速系统 处理引擎 通用处理器 总线 加速器系统 精简指令集 外部存储器 存储模块 控制总线 命令传输 时间测量 数据传输 数据总线 主机端 加速器 映射 能效 软核 流水线 收益 通信
【主权项】:
1.基于现场可编程门阵列的卷积神经网络加速系统,其特征在于,包括:通用处理器,与现场可编程门阵列进行通信;存储模块,用于通用处理器与现场可编程门阵列的数据交互;现场可编程门阵列,用于加速卷积神经网络的计算过程;还包括统一的编程接口,供用户调用所述加速系统完成相应的任务;整个加速系统的执行过程分为以下几步:S1:通用处理器端通过提供的编程接口选择合适的加速器,并把计算过程中需要使用的输入数据和权值数据写入存储器中;S2:现场可编程门阵列中的加速器从存储器中读取输入数据和权值数据并开始计算,并把最后的计算结果写入存储器中;S3:通用处理器从存储器中读取计算完成以后的结果输出到屏幕。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学苏州研究院,未经中国科学技术大学苏州研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810497946.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top