[发明专利]用分布流水线可分离卷积运算将卷积映射到相连处理元件在审
申请号: | 202110429712.5 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113536216A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 阿卜杜勒卡迪尔·乌特库·迪里尔;克里希纳库马尔·纳拉亚南·奈尔;阿努普·拉梅什·卡德科尔;伊赫桑·基什阿德斯坦尼扎德;郝宇辰;托马斯·马克·乌尔里希;拉凯什·科姆拉韦利;阿敏·费鲁沙希安;马丁·沙茨;奥利维亚·吴 | 申请(专利权)人: | 脸谱公司 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06F17/16;G06F7/50;G06F7/52 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 周靖;杨明钊 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布 流水线 可分离 卷积 运算 映射 相连 处理 元件 | ||
1.一种处理器系统,包括:
多个点积处理器单元,其被配置为执行具有多个通道的数据矩阵与多个逐深度卷积权重矩阵的逐深度卷积,所述多个逐深度卷积权重矩阵包括用于所述多个通道中的每个通道的单独的逐深度卷积权重矩阵,其中所述点积处理器单元中的每一个被配置为执行用于所述多个通道中包括的一个或更多个通道的逐深度卷积的至少一部分;和
多个逐元素乘法单元,其被配置为至少部分地执行逐点卷积的乘法运算,其中所述逐元素乘法单元中的每一个被配置为向从所述点积处理器单元中的一个或更多个接收的每个逐深度卷积部分结果元素应用来自多个逐点卷积权重滤波器的每个逐点卷积权重滤波器的对应数据元素,以确定逐元素乘法单元结果;
其中所述处理器系统被配置成将来自所述多个逐元素乘法单元的逐元素乘法单元结果的数据元素的不同组相加在一起,以至少部分地计算所述逐点卷积的结果的不同数据元素。
2.根据权利要求1所述的系统,其中所述多个逐元素乘法单元被配置为在所述逐深度卷积完成之前至少部分地执行所述逐点卷积的乘法运算。
3.根据权利要求1所述的系统,其中所述处理器系统被配置为至少部分并行地将来自所述逐元素乘法单元结果的数据元素的不同组相加在一起。
4.根据权利要求1所述的系统,其中所述点积处理器单元中的每一个包括多个计算单元。
5.根据权利要求4所述的系统,其中所述多个计算单元中的每个计算单元包括向量乘法单元和向量加法器单元。
6.根据权利要求5所述的系统,其中所述向量加法器单元包括加法器树。
7.根据权利要求1所述的系统,其中所述数据矩阵是三维机器学习数据矩阵。
8.根据权利要求1所述的系统,其中所述单独的逐深度卷积权重矩阵和所述多个逐点卷积权重滤波器中的每一个逐点卷积权重滤波器是机器学习权重矩阵。
9.根据权利要求1所述的系统,其中所述单独的逐深度卷积权重矩阵是3x3矩阵。
10.根据权利要求1所述的系统,其中所述单独的逐深度卷积权重矩阵是3x3、5x5、7x7、9x9或11x11矩阵。
11.根据权利要求1所述的系统,其中所述多个逐点卷积权重滤波器中的每一个具有对应于所述数据矩阵的多个通道的计数的通道深度。
12.根据权利要求1所述的系统,还包括:
多个缩减单元;
多个点对点连接,其中所述多个点对点连接的每个点对点连接被配置为向所述多个缩减单元中的第二缩减单元提供所述多个缩减单元中的第一缩减单元的结果;和
通信总线,其将所述多个点积处理器单元连接在一起。
13.根据权利要求12所述的系统,其中所述第一缩减单元包括被配置为执行向量加法运算的加法器。
14.根据权利要求12所述的系统,其中所述多个点积处理器单元中的每一个被配置成经由所述通信总线接收逐深度卷积运算指令。
15.根据权利要求12所述的系统,其中所述多个逐元素乘法单元中的每一个被配置成经由所述通信总线接收逐点卷积运算指令。
16.根据权利要求12所述的系统,其中所述多个缩减单元中的所述第二缩减单元被配置为将所述多个逐元素乘法单元中的逐元素乘法单元的局部结果与所述多个缩减单元中的所述第一缩减单元的缩减结果相加在一起,以确定缩减单元结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸谱公司,未经脸谱公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110429712.5/1.html,转载请声明来源钻瓜专利网。