[发明专利]脉动阵列和处理系统有效
申请号: | 201911286293.3 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111666255B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 南智勋 | 申请(专利权)人: | 爱思开海力士有限公司 |
主分类号: | G06F15/80 | 分类号: | G06F15/80 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 赵永莉;李新娜 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 脉动 阵列 处理 系统 | ||
本公开涉及一种处理系统。该处理系统可以包括脉动阵列,该脉动阵列包括排列成M行和N列的多个处理元件(PE),其中M和N是自然数,且M不等于N。该处理系统可以进一步包括行缓冲器和列缓冲器,其中行缓冲器在行方向上将行数据传送到脉动阵列,列缓冲器在列方向上将列数据传送到脉动阵列。当处理系统处于第一模式时,行数据是输入数据,列数据是权重。当处理系统处于第二模式时,行数据是权重,列数据是输入数据。
相关申请的交叉引用
本申请要求于2019年3月7日提交的申请号为10-2019-0026198的韩国专利申请的优先权,其全部内容通过引用整体并入本文。
技术领域
示例性实施例涉及一种脉动阵列和包括该脉动阵列的处理系统。
背景技术
卷积神经网络(CNN)是一种常用于图像识别和分析的处理系统。这样的处理系统执行卷积运算,例如通过应用特定滤波器从图像中提取特征。脉动阵列可以用于这种操作。
脉动阵列包括布置成多个行和多个列的多个处理元件(PE)。因为在许多情况下可只用到多个PE中的一些PE,脉动阵列的利用率可能较低。
发明内容
各个实施例涉及提供一种增加脉动阵列的利用率的技术。
在实施例中,一种处理系统可以包括:脉动阵列,包括排列成M行和N列的多个处理元件(PE),其中M和N是自然数,并且M不等于N;行缓冲器,被配置为在行方向上将行数据传送到脉动阵列,其中当处理系统处于第一模式时,行数据是输入数据,当处理系统处于第二模式时,行数据是权重;以及列缓冲器,被配置为在列方向上将列数据传送到脉动阵列,其中当处理系统处于第一模式时,列数据是权重,以及当处理系统处于第二模式时,列数据是输入数据。
在实施例中,一种脉动阵列可以包括:M个行输入,被配置为在第一模式下将输入数据作为行数据传送,在第二模式下将权重作为行数据传送,其中M是自然数;N个列输入,被配置为在第一模式下将权重作为列数据传送,在第二模式下将输入数据作为列数据传送,其中N为自然数,并且N不等于M;以及M*N个处理元件(PE),每个PE被配置为对传送到M个行输入之中与PE相对应的行输入的行数据和传送到N个列输入之中与PE相对应的列输入的列数据执行乘法运算,然后将乘法运算的结果与先前运算的结果相加。
附图说明
图1示出根据实施例的脉动阵列。
图2示出可以使用脉动阵列执行的说明性的矩阵乘法运算。
图3示出如何将输入数据矩阵和权重矩阵输入到脉动阵列,以使用4X2脉动阵列执行图2的矩阵乘法运算。
图4示出使用图3的脉动阵列执行图2的矩阵乘法运算的运算结果。
图5示出可以使用脉动阵列执行的另一说明性的矩阵乘法运算。
图6示出当使用4X2脉动阵列执行图5的矩阵乘法运算时,如何将输入数据矩阵和权重矩阵输入到脉动阵列。
图7示出使用图6的脉动阵列执行图5的矩阵乘法运算的运算结果。
图8示出根据实施例的处理系统800。
图9示出当使用图8的处理系统的第二模式执行将2X3输入数据矩阵和3X4权重矩阵相乘的诸如图5所示的矩阵乘法运算时,如何将输入数据矩阵和权重矩阵输入到图8的脉动阵列。
图10示出使用图8的脉动阵列执行图5的矩阵乘法运算的运算结果。
图11示出在被输出转换器转换之后,使用图8的脉动阵列执行图5的矩阵乘法运算的运算结果。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱思开海力士有限公司,未经爱思开海力士有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911286293.3/2.html,转载请声明来源钻瓜专利网。