[发明专利]一种基于FPGA的MobileNet硬件加速系统在审

专利信息
申请号: 202210675284.9 申请日: 2022-06-15
公开(公告)号: CN114911628A 公开(公告)日: 2022-08-16
发明(设计)人: 魏榕山;林宇轩;陈标发 申请(专利权)人: 福州大学
主分类号: G06F9/50 分类号: G06F9/50;G06N3/04
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 陈明鑫;蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 fpga mobilenet 硬件加速 系统
【权利要求书】:

1.一种基于FPGA的MobileNet硬件加速系统,其特征在于,包括PL端、CPU端、通信模块、存储模块,PL端负责MobileNet网络的加速实现,CPU端负责统筹协调任务并发送指令;

所述PL端包括核心控制模块及与该核心控制模块连接的各运算模块;

所述通信模块用于实现PL端与CPU端、存储模块的数据传输;

所述存储模块用于协调存储PL端数据。

2.根据权利要求1所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,PL端通过配置直接存储器访问与存储模块通信实现输入输出数据的传输,指令存储于PL端的BRAM。

3.根据权利要求1所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,所述核心控制模块为Command Analyzer,负责解析Command Queue发来的指令,并输出相应的控制信号控制各运算模块运行,Command Queue通过通信模块与CPU端进行交互,核心控制模块采用状态机实现。

4.根据权利要求1所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,所述各运算模块分别为深度卷积模块、逐点卷积模块、SoftMax模块以及平均池化模块,各运算模块受核心控制模块控制,从输入缓冲区读取输入特征图,利用DSP资源进行相应计算,中间数据缓存于输出缓冲区,计算完成后进行量化、激活,最终存入输入缓冲区。

5.根据权利要求1所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,所述存储模块为片外DDR存储器。

6.根据权利要求1所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,所述通信模块采用AXI4以及AXI4-Lite总线。

7.根据权利要求4所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,所述深度卷积模块兼容标准卷积,深度卷积模块的实现方式为:MobileNet网络中共包含一层标准卷积层以及十三层深度卷积层,共十四层网络层,考虑到FPGA资源及MobileNet网络结构特征,按照32 x 18的并行展开度对输入特征图通道数及尺寸两个维度进行展开,通过重复设计包括乘法器、加法器的树资源实现深度卷积并行展开计算;此外,运用流水线技术对深度卷积计算过程进行优化,将深度卷积操作过程进行细分,以周期为单位细分包括读取数据、乘法、累加、缓存中间数据、读取缓存数据的一系列操作,使得每个环节在每个周期都有连续的输入与输出。

8.根据权利要求4所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,所述逐点卷积模块兼容全连接层,逐点卷积模块的实现方式为:考虑到FPGA资源及逐点卷积层结构特征,按照32 x 32 的并行展开度对输入特征图通道数及过滤器组数两个维度进行展开,通过重复设计包括乘法器、加法器的树资源实现逐点卷积并行展开计算;此外,利用流水线技术对逐点卷积计算过程进行优化,将逐点卷积操作过程进行细分,以周期为单位细分包括读取数据、乘法、累加、缓存中间数据、读取缓存数据的一系列操作,使得每个环节在每个周期都有连续的输入与输出,而不互相依赖,实现流水线设计;当逐点卷积的行列数均退化为1以后其与全连接层操作一致,因此,全连接层即为输入特征图尺寸为1 x 1的逐点卷积层。

9.根据权利要求4所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,所述平均池化模块的实现方式为:考虑到卷积模块架构及存储模块的设计,并结合平均池化层运算特点,按照32 x 7 的并行展开度对输入特征图通道数及输入特征图行数两个维度进行展开,通过重复设计包括加法器树、除法器的树资源实现平均池化并行展开计算;此外,运用流水线技术对平均池化计算过程进行优化,将平均池化过程进行细分,以周期为单位细分包括读取数据、累加、除法以及保存输出数据的一系列操作,使得每个环节在每个周期都有连续的输入与输出。

10.根据权利要求4所述的一种基于FPGA的MobileNet硬件加速系统,其特征在于,所述SoftMax模块的实现方式为:考虑到SoftMax层的主要作用在于概率映射,是否计算SoftMax函数并不影响分类结果,因此SoftMax层利用比较器进行大小上的比较。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210675284.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top