[发明专利]一种通用CNN推理加速器及其控制方法、可读存储介质在审
| 申请号: | 201911243224.4 | 申请日: | 2019-12-06 |
| 公开(公告)号: | CN111105015A | 公开(公告)日: | 2020-05-05 |
| 发明(设计)人: | 徐天赐;景璐 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N5/04 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘翠香 |
| 地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 通用 cnn 推理 加速器 及其 控制 方法 可读 存储 介质 | ||
1.一种通用CNN推理加速器,其特征在于,包括:
预处理模块,用于获取目标数据、卷积核数据以及模块时序;
卷积与激活模块,用于对所述目标数据进行卷积计算和激活计算;
池化模块,用于对所述目标数据进行池化计算或数据结构转换;
所述模块时序包括所述目标数据进入所述卷积与激活模块和/或所述池化模块的顺序。
2.根据权利要求1所述通用CNN推理加速器,其特征在于,所述池化模块包括:
通用池化模块,用于对所述目标数据进行预设尺寸的池化计算或数据结构转换;
全尺寸池化模块,用于对所述目标数据进行全尺寸的池化计算;
所述模块时序具体包括所述目标数据通过所述卷积与激活模块和/或所述通用池化模块和/或所述全尺寸池化模块的顺序。
3.根据权利要求1所述通用CNN推理加速器,其特征在于,所述池化计算具体为:最大值池化计算或平均池化计算。
4.根据权利要求3所述通用CNN推理加速器,其特征在于,所述通用CNN推理加速器为单层实例实现的推理加速器。
5.根据权利要求3所述通用CNN推理加速器,其特征在于,所述通用CNN推理加速器为多层实例实现的推理加速器。
6.根据权利要求1至5任一项所述通用CNN推理加速器,其特征在于,还包括:
数据组织模块,用于组织所述目标数据的数据流;
存储访问模块,用于计算所述目标数据对应的存储地址。
7.根据权利要求6所述通用CNN推理加速器,其特征在于,所述通用CNN推理加速器为基于ASIC或FPGA的推理加速器。
8.一种通用CNN推理加速器的控制方法,其特征在于,应用于如权利要求1至7任一项所述通用CNN推理加速器,包括:
通过预处理模块获取目标数据、卷积核数据以及模块时序;所述模块时序包括所述目标数据进入卷积与激活模块和/或池化模块的顺序;
根据所述模块时序,通过所述卷积与激活模块对所述目标数据进行卷积计算和激活计算和/或通过所述池化模块对所述目标数据进行池化计算或数据结构转换。
9.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求8所述通用CNN推理加速器的控制方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911243224.4/1.html,转载请声明来源钻瓜专利网。





