[发明专利]向量计算单元在审
申请号: | 201880059404.4 | 申请日: | 2018-06-20 |
公开(公告)号: | CN111095242A | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | D·达斯·萨玛;E·塔尔佩斯;P·J·班农 | 申请(专利权)人: | 特斯拉公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F15/16 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向量 计算 单元 | ||
1.一种微处理器系统,包括:
计算阵列,所述计算阵列包括多个计算单元;以及
向量计算单元,所述向量计算单元与所述计算阵列通信。
2.根据权利要求1所述的系统,其中所述向量计算单元包括多个处理元件,并且所述处理元件被配置为接收来自所述计算阵列的输出数据元素,并且并行处理所接收的输出数据元素。
3.根据权利要求2所述的系统,其中所述处理元件响应于单个处理器指令而并行处理所接收的输出数据元素。
4.根据权利要求1所述的系统,其中所述计算阵列包括矩阵处理器。
5.根据权利要求1所述的系统,其中所述计算阵列被配置为接收两个向量输入操作数。
6.根据权利要求1所述的系统,其中所述多个计算单元中的每个计算单元包括算术逻辑单元、累加器、以及影子寄存器。
7.根据权利要求1所述的系统,其中所述多个计算单元中的每个计算单元被配置为执行乘法操作和加法操作。
8.根据权利要求1所述的系统,其中所述多个计算单元中的每个计算单元被配置为执行点积分量操作。
9.根据权利要求1所述的系统,其中所述多个计算单元中的每个计算单元被配置为响应于单个计算阵列指令而并行计算点积结果分量。
10.根据权利要求2所述的系统,其中所述多个处理元件中的每个处理元件包括算术逻辑单元,所述算术逻辑单元被配置为与其他处理元件并行执行算术逻辑单元操作。
11.根据权利要求2所述的系统,其中通知信号标识着来自所述计算阵列的输出数据元素准备好用于所述向量计算单元。
12.根据权利要求1所述的系统,其中所述计算阵列被配置为作为先进先出队列来操作。
13.根据权利要求2所述的系统,其中来自所述计算阵列的所述输出数据元素与点积结果相对应。
14.根据权利要求2所述的系统,其中来自所述计算阵列的所述输出数据元素与对图像数据执行的卷积结果相对应。
15.根据权利要求3所述的系统,其中所述单个处理器指令用于计算非线性函数的结果。
16.根据权利要求15所述的系统,其中所述非线性函数是修正线性单元函数或S形函数。
17.根据权利要求1所述的系统,还包括后处理单元,所述后处理单元与所述向量计算单元通信。
18.根据权利要求17所述的系统,其中所述后处理单元被配置为执行池化功能。
19.根据权利要求2所述的系统,其中从所述计算阵列接收的所述输出数据元素被存储在累加器中。
20.根据权利要求19所述的系统,其中所述多个处理元件中的每个处理元件被配置为访问所述累加器的切片和一个或多个向量寄存器的切片。
21.根据权利要求2所述的系统,其中所述向量计算单元还包括多个向量寄存器,所述多个向量寄存器的大小被设计为适合于来自所述计算阵列的所述输出数据元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯拉公司,未经特斯拉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880059404.4/1.html,转载请声明来源钻瓜专利网。