[发明专利]一种基于FPGA的卷积神经网络加速系统有效
申请号: | 201810710069.1 | 申请日: | 2018-07-02 |
公开(公告)号: | CN109086867B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 李开;邹复好;孙浩;李全;祁迪;贺坤坤 | 申请(专利权)人: | 武汉魅瞳科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 赵伟 |
地址: | 430074 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于FPGA的卷积神经网络加速系统,基于OpenCL编程框架对FPGA上的卷积神经网络进行加速,该卷积神经网络加速系统包括数据预处理模块、数据后处理模块、卷积神经网络计算模块、数据存储模块和网络模型配置模块;其中卷积神经网络计算模块包括卷积计算子模块、激活函数计算子模块、池化计算子模块和全连接计算子模块;本发明提供的该加速系统在使用过程中可以根据FPGA的硬件资源情况设置计算并行度从而适配不同的FPGA和不同的卷积神经网络,能够在FPGA上高效并行流水化方式运行卷积神经网络,并且能有效地降低系统功耗和大大提高卷积神经网络的处理速度,满足实时性要求。 | ||
搜索关键词: | 一种 基于 fpga 卷积 神经网络 加速 系统 | ||
【主权项】:
1.一种基于FPGA的卷积神经网络加速系统,其特征在于,包括数据预处理模块、卷积神经网络计算模块、数据后处理模块、数据存储模块和网络模型配置模块;所述数据预处理模块、卷积神经网络计算模块和数据后处理模块基于FPGA实现,数据存储模块基于FPGA片外存储实现,网络模型配置模块基于FPGA的片上存储实现;所述数据预处理模块用于根据当前所处的计算阶段从数据存储模块中读取相应的卷积核参数和输入特征图,并对卷积核参数和输入特征图进行预处理:将4维卷积核参数整理成3维,并对输入特征图利用滑动窗口展开并复制,使得滑动窗口中的局部特征图与卷积核参数一一对应,获得便于直接计算的卷积核参数序列和局部特征图系列;预处理完成后将处理好的卷积核参数和输入特征图发送到卷积神经网络计算模块;所述网络模型配置模块用于对卷积神经网络计算模块进行参数配置;所述卷积神经网络计算模块将卷积神经网络中的卷积层、激活函数层、池化层和全连接层独立设置,通过参数配置来构建多种不同的网络结构,并根据配置参数对接收自数据预处理模块的卷积核参数和输入特征图进行卷积、激化、池化和全连接计算的层间流水处理,处理结果发送到数据后处理模块;所述数据后处理模块用于将卷积神经网络计算模块的输出数据写入到数据存储模块中;所述数据存储模块用于存储卷积神经网络的模型参数caffemodel、中间特征图计算结果和最终计算结果,该模块通过PCIe接口与外部宿主机进行数据交换。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉魅瞳科技有限公司,未经武汉魅瞳科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810710069.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于嵌入式设备的部分二值卷积方法
- 下一篇:一种抽象图像情感识别方法