[发明专利]用于并行处理器的编译器在审
申请号: | 202210857034.7 | 申请日: | 2022-07-20 |
公开(公告)号: | CN115640011A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | B·贝克曼;J·D·库克 | 申请(专利权)人: | GSI科技公司 |
主分类号: | G06F8/41 | 分类号: | G06F8/41;G06F9/30;G06F9/38;G06F17/16 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘文灿 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 并行 处理器 编译器 | ||
1.一种用于在关联处理单元(APU)中并发地执行多个计算的方法,所述方法包括:
在施主矩阵和左接收器矩阵中具有数据,其中,所述矩阵分别表示存储在所述APU的存储器阵列的第一部分和第二部分中的数据,并且其中,每个部分包括布置成行和列的单元,其中,激活位于不同部分中相同位置处的第一单元和第二单元提供所述第一单元和所述第二单元之间的布尔运算的结果;
通过计算指示选定行的第一位向量和指示选定列的第二位向量之间的外积来创建Tartan矩阵,其中,所述Tartan矩阵表示存储在所述存储器阵列的第三部分中的数据,并且其中,在所述Tartan矩阵中具有值1的所有单元都是选定单元;以及
并发地激活所述施主矩阵、所述左接收器矩阵和所述Tartan矩阵的所有单元并且将它们之间的布尔运算的结果存储在所述左接收器矩阵中,其中,新值获得于与所述Tartan矩阵中的所述选定单元位于相同行和相同列处的单元上,并且原始值保留在其他单元上。
2.根据权利要求1所述的方法,其中,所述创建Tartan矩阵包括:将所述第三部分中的单元初始化为值0,以及并发地将位于所述第三部分中的所述选定行和所述选定列中的任何一个中的单元设置为值1。
3.根据权利要求1所述的方法,其中,所述并发地激活还包括:
并发地在存储所述施主矩阵的所有单元和存储所述左接收器矩阵的所有单元之间执行XOR布尔运算,并且将结果存储在临时矩阵中,所述临时矩阵存储于所述存储器阵列的临时部分中;
并发地在所述Tartan矩阵的所有单元和所述临时矩阵的所有单元之间执行AND布尔运算,并且将结果存储在所述临时矩阵中;
并发地在所述左接收器矩阵的所有单元和所述临时矩阵的所有单元之间执行XOR布尔运算,并且将结果存储在所述临时矩阵中;以及
并发地将所述临时矩阵的所有单元复制到所述左接收器矩阵,从而在所述左接收器矩阵中提供所述施主矩阵的选定单元的值。
4.根据权利要求1所述的方法,其中,所述并发地激活还包括:
并发地在所述施主矩阵的所有单元和所述Tartan矩阵的所有单元之间执行AND布尔运算,并且将结果存储在临时矩阵中,所述临时矩阵存储于所述存储器阵列的临时部分中;
并发地在所述左接收器矩阵的所有单元和所述临时矩阵的所有单元之间执行XOR布尔运算,并且将结果存储在所述临时矩阵中;以及
并发地将所述临时矩阵的所有单元复制到所述左接收器矩阵,从而在所述左接收器矩阵中提供所述左接收器矩阵的选定单元和所述施主矩阵的选定单元之间的XOR运算的结果。
5.根据权利要求1所述的方法,其中,所述并发地激活还包括:
并发地在所述施主矩阵的所有单元和所述左接收器矩阵的所有单元之间执行AND布尔运算,并且将结果存储在临时矩阵中,所述临时矩阵存储于所述存储器阵列的临时部分中;
并发地在所述左接收器矩阵的所有单元和所述临时矩阵的所有单元之间执行XOR布尔运算,并且将结果存储在所述临时矩阵中;
并发地在所述Tartan矩阵的所有单元和所述临时矩阵的所有单元之间执行AND布尔运算,并且将结果存储在所述临时矩阵中;
并发地在所述左接收器矩阵的所有单元和所述临时矩阵的所有单元之间执行XOR布尔运算,并且将结果存储在所述临时矩阵中;以及
并发地将所述临时矩阵的所有单元复制到所述左接收器矩阵,从而在所述左接收器矩阵中提供所述左接收器矩阵的选定单元和所述施主矩阵的选定单元之间的AND运算的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于GSI科技公司,未经GSI科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210857034.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:马桶座圈组件
- 下一篇:同轴旋转自动台阶表面