[实用新型]一种基于FPGA的CNN加速优化装置有效
申请号: | 201820882227.7 | 申请日: | 2018-06-08 |
公开(公告)号: | CN208283943U | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 葛化敏;潘伟文;许四杰;刘海鑫 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06F15/78 | 分类号: | G06F15/78;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王安琪 |
地址: | 211500 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 外部存储器模块 本实用新型 片上系统 优化装置 主控模块 卷积神经网络 存储器接口 并行处理 降低功耗 卷积计算 算法效率 低功耗 复杂度 高效能 正确率 算法 保证 | ||
1.一种基于FPGA的CNN加速优化装置,其特征在于,包括:主控模块和外部存储器模块;主控模块具体为FPGA片上系统,外部存储器模块具体为DDR3 DRAM,DDR3 DRAM直接连接到了FPGA片上系统的BANK37、BANK38和BANK39的存储器接口上。
2.如权利要求1所述的基于FPGA的CNN加速优化装置,其特征在于,DDR3 DRAM内存条的存储空间为1GB,由8片容量为128M的内存芯片U1、U2、U3、U4、U6、U7、U8和U9组成;U1、U2、U3和U4排列在内存条的正面,U6、U7、U8和U9排列在内存条的背面,将8个内存芯片的片选引脚CS#连接到芯片选择引脚S0#上,S0#引脚用来使能和禁止命令译码。
3.如权利要求2所述的基于FPGA的CNN加速优化装置,其特征在于,DDR3 DRAM中,每个内存芯片的ZQ引脚外接一个240Ω的电阻与地相连,用来校准芯片的ODT和输出驱动。
4.如权利要求1所述的基于FPGA的CNN加速优化装置,其特征在于,FPGA片上系统包括定时器、串口、MicroBlaze处理器、加速器、第一数据传输引擎、第二数据传输引擎、中断控制器和、存储器接口控制器、AXI4lite总线和AXI4总线;定时器、串口、加速器和MicroBlaze处理器分别与AXI4lite总线相连,MicroBlaze处理器、第一数据传输引擎、第二数据传输引擎和存储器接口控制器分别与AXI4总线相连,加速器与第一数据传输引擎和第二数据传输引擎分别相连,中断控制器连接在加速器和MicroBlaze处理器之间。
5.如权利要求4所述的基于FPGA的CNN加速优化装置,其特征在于,AXI4lite总线用于传输命令,AXI4总线用于传输数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201820882227.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子商务用对账查核系统
- 下一篇:施工升降机驾驶员身份识别系统