[发明专利]利用相同处理单元实施不同类型的卷积运算的方法和装置有效
申请号: | 201711248920.5 | 申请日: | 2017-12-01 |
公开(公告)号: | CN108133265B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | M.莱勒;D.卡帕利贾;A.凌 | 申请(专利权)人: | 阿尔特拉公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 王健;郑冀之 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 相同 处理 单元 实施 不同类型 卷积 运算 方法 装置 | ||
1.一种用于在目标设备上实施卷积神经网络CNN硬件加速器的方法,包括:
利用卷积神经网络CNN硬件加速器上的一个或多个处理单元实施卷积;
修改卷积神经网络CNN硬件加速器的配置以便改变由卷积神经网络CNN硬件加速器实施的滤波器并且改变滤波器的输出数据的格式化;以及
响应于输出数据的格式化和滤波器中的改变,利用所述一个或多个处理单元实施反卷积和后向传播卷积之一。
2.根据权利要求1所述的方法,其中,修改卷积神经网络CNN硬件加速器的配置包括:
从反卷积滤波器生成多个卷积滤波器;以及
把通过使用所述多个卷积滤波器在反卷积输入数据上实施卷积而生成的卷积结果进行交织,从而产生反卷积输出数据。
3.根据权利要求2所述的方法,其中,从反卷积滤波器生成多个卷积滤波器包括:
基于步幅从反卷积滤波器提取出更小的卷积滤波器;以及
沿着x和y轴反射所述更小的卷积滤波器中的每一个。
4.根据权利要求1所述的方法,其中,修改卷积神经网络CNN硬件加速器的配置包括:
将卷积滤波器重新格式化成后向传播卷积滤波器;
从所述后向传播卷积滤波器生成多个卷积滤波器;以及
把通过使用所述多个卷积滤波器在后向传播卷积输入数据上实施卷积而生成的卷积结果进行交织,从而产生后向传播卷积输出数据。
5.根据权利要求4所述的方法,其中,重新格式化卷积滤波器包括:通过把具有k个深度为c的滤波器的卷积层变换成c个深度为k的滤波器而对卷积滤波器进行重包装。
6.根据权利要求1所述的方法,其中,由驻留在卷积神经网络CNN硬件加速器上的变换单元在卷积神经网络CNN硬件加速器的运行时间期间实施所述修改。
7.根据权利要求2所述的方法,其中,在卷积神经网络CNN硬件加速器的运行时间之前实施从反卷积滤波器生成所述多个卷积滤波器。
8.根据权利要求1所述的方法,其中,所述一个或多个处理单元在不同的时刻实施卷积、反卷积和后向传播卷积。
9.根据权利要求1所述的方法,其中,每一个所述处理单元包括:
高速缓存;
实施点积运算的计算单元;以及
累加单元。
10.一种具有指令序列的非瞬时性计算机可读介质,所述指令序列包括指令,所述指令在被执行时使得处理器实施根据权利要求1-9中的任一项所述的方法。
11.一种实施在目标设备上的卷积神经网络CNN硬件加速器,包括:
在第一配置期间协调目标上的组件之间的第一数据流程并且在第二配置期间协调目标上的组件之间的第二数据流程的定序器单元;
在第一配置期间实施卷积并且在第二配置期间实施反卷积和后向传播卷积之一的多个处理单元。
12.根据权利要求11所述的卷积神经网络CNN硬件加速器,还包括变换单元,所述变换单元包括:
从反卷积滤波器生成多个卷积滤波器的卷积滤波器提取单元;以及
把通过使用所述多个卷积滤波器在反卷积输入数据上实施卷积而生成的卷积结果进行交织从而产生反卷积输出数据的交织单元。
13.根据权利要求11所述的卷积神经网络CNN硬件加速器,还包括变换单元,所述变换单元包括:
把卷积滤波器重新格式化成后向传播卷积滤波器的滤波器重包装单元;
从所述后向传播卷积滤波器生成多个卷积滤波器的卷积滤波器提取单元;以及
把通过使用所述多个卷积滤波器在后向传播卷积输入数据上实施卷积而生成的卷积结果进行交织从而产生后向传播卷积输出数据的交织单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿尔特拉公司,未经阿尔特拉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711248920.5/1.html,转载请声明来源钻瓜专利网。