[发明专利]张量处理器有效
申请号: | 201910301388.1 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110033085B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 许喆;丁雪立;陈柏纲 | 申请(专利权)人: | 广州异构智能科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何冲;黄隶凡 |
地址: | 511458 广东省广州市南沙区南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 张量 处理器 | ||
1.一种张量处理器,其包括:
乒乓控制器,其接收输入张量;
与所述乒乓控制器相连的多个处理引擎;
其中,所述乒乓控制器根据所述输入张量的维度计算出要调用的处理引擎的个数并且调用所述个数的处理引擎组成处理引擎二维阵列,并根据所述处理引擎二维阵列的维度切割所述输入张量,以使切割后的输入张量适应所述处理引擎二维阵列的维度,配置所述处理引擎二维阵列中的处理引擎之间的连接关系和数据流向,以及配置所述切割后的输入张量和权重张量到所述处理引擎二维阵列;
所述处理引擎二维阵列对所述切割后的输入张量和所述权重张量进行卷积运算得到输出结果,所述输出结果被传输到所述乒乓控制器。
2.根据权利要求1所述的张量处理器,其特征在于,所述乒乓控制器根据所述输入张量的维度和所述权重张量的维度计算出所述个数。
3.根据权利要求1所述的张量处理器,其特征在于,所述乒乓控制器根据所述输入张量的维度和所述权重张量的维度配置所述处理引擎二维阵列中的处理引擎之间的连接关系和数据流向。
4.根据权利要求1所述的张量处理器,其特征在于,所述乒乓控制器根据所述输入张量的维度和所述处理引擎二维阵列的维度设置所述处理引擎二维阵列中的一部分处理引擎为待机状态。
5.根据权利要求3所述的张量处理器,其特征在于,所述乒乓控制器根据所述输入张量的维度和所述权重张量的维度调整已经配置的所述处理引擎二维阵列中的处理引擎之间的连接关系和数据流向。
6.根据权利要求2所述的张量处理器,其特征在于,所述乒乓控制器根据新的输入张量的维度和新的权重张量的维度计算出不同于所述个数的新个数,调用所述新个数的处理引擎并组成新的处理引擎二维阵列。
7.根据权利要求1所述的张量处理器,其特征在于,所述乒乓控制器更新所述处理引擎二维阵列中的第一部分处理引擎的已经配置的权重张量,保持所述处理引擎二维阵列中的第二部分处理引擎的已经配置的权重张量不变,并更新所述第二部分处理引擎的已经配置的输入张量。
8.根据权利要求1所述的张量处理器,其特征在于,所述乒乓控制器配置所述处理引擎二维阵列中的每一个处理引擎让其自带池化操作。
9.根据权利要求1所述的张量处理器,其特征在于,所述处理引擎二维阵列有两个维度,所述两个维度中的一个为N,其中N为大于等于2的正整数,所述权重张量划分成N组权重数据,所述N组权重数据的每一组包含同样数量的权重数据,所述输入张量划分成M组输入数据,其中M为大于等于N的正整数,所述M组输入数据的每一组包含同样数量的输入数据,所述乒乓控制器配置所述M组输入数据和所述N组权重数据到所述处理引擎二维阵列,所述处理引擎二维阵列中的每一个处理引擎接收一组输入数据和一组权重数据并且对配置到该处理引擎的所述输入数据和所述权重数据进行卷积运算得到中间结果。
10.根据权利要求9所述的张量处理器,其特征在于,所述处理引擎二维阵列的维度为3×3,所述权重张量划分成3组权重数据,每组权重数据有3个权重数据,所述输入张量划分成5组输入数据,每组输入数据有5个输入数据。
11.根据权利要求9所述的张量处理器,其特征在于,所述处理引擎二维阵列通过所述乒乓控制器读取和写入所述中间结果。
12.根据权利要求9所述的张量处理器,其特征在于,所述处理引擎二维阵列具有全连接结构,所述中间结果不经过所述乒乓控制器的读取和写入而在所述处理引擎二维阵列内部叠传。
13.根据权利要求1所述的张量处理器,其特征在于,所述乒乓控制器通过组播传输方式配置所述输入张量和所述权重张量到所述处理引擎二维阵列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州异构智能科技有限公司,未经广州异构智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910301388.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:突触系统与突触方法
- 下一篇:用于神经网络卷积运算的硬件加速器