[发明专利]以摩尔图为拓扑结构的并行矩阵乘计算的方法和系统无效
申请号: | 201210100920.1 | 申请日: | 2012-04-09 |
公开(公告)号: | CN102737010A | 公开(公告)日: | 2012-10-17 |
发明(设计)人: | 张冰;昝程 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 深圳市君胜知识产权代理事务所 44268 | 代理人: | 刘文求;杨宏 |
地址: | 518054 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摩尔 拓扑 结构 并行 矩阵 计算 方法 系统 | ||
1.一种以摩尔图为拓扑结构的处理器的并行矩阵乘计算的方法,用于对第一矩阵AM×N和第二矩阵BN×P进行相乘计算,使其得到乘积矩阵CM×P,其中,所述摩尔图的直径为2,度为δ,处理器的个数q=δ2+1,其特征在于,所述方法包括以下步骤:
S1、将第一矩阵AM×N按行分解为q个每个大小为m行N列的第一矩阵分块,将第二矩阵BN×P按列分解为q个每个大小为N行p列的第二矩阵分块;其中,m=M除以q,p=P除以q;
S2、每个处理器Pi随机地接收一个第一矩阵分块和一个第二矩阵分块,完成乘积矩阵CM×P中大小为m行p列的第i个矩阵分块Cm×p的计算;
S3、将乘积矩阵分块Cm×p叠加在一起,组成乘积矩阵CM×P。
2.根据权利要求1所述的以摩尔图为拓扑结构的处理器的并行矩阵乘计算的方法,其特征在于,在所述步骤S1中,通过对第一矩阵AM×N和第二矩阵BN×P添加若干值为0的行和列,确保m、p的值为整数。
3.根据权利要求1所述的以摩尔图为拓扑结构的处理器的并行矩阵乘计算的方法,其特征在于,所述步骤S2进一步包括:
S21、每个处理器随机地接收一个第一矩阵分块和一个第二矩阵分块;
S22、每个处理器将分配给自己的1个第一矩阵分块传送给相邻的δ个处理器;
S23、每个处理器Pi收到来自相邻处理器传送的δ个第一矩阵分块后,检查其中及本身初始分配的第一矩阵分块中是否有第一矩阵的第i个矩阵分块,若有则保存到处理器相应的寄存器中,若无则进行步骤S24;
S24、每个处理器将步骤S24中收到的第一矩阵分块中除了来自要发送处理器的第一矩阵分块外的(δ-1)个第一矩阵分块分别传送给相邻的处理器;
S25、每个处理器Pi收到来自相邻处理器传送的δ×(δ-1)个第一矩阵分块后,检查其中是否有第一矩阵的第i个矩阵分块,若有则保存到处理器相应的寄存器中;
S26、每个处理器将分配给自己的1个第二矩阵分块传送给相邻的δ个处理器;
S27、各处理器Pi将保存到各自寄存器的第一矩阵分块分别与本身初始分配的第二矩阵分块,以及来自相邻处理器传送的δ个第二矩阵的矩阵分块相乘,得到乘积矩阵C的第i个分块的(δ+1)个列子分块;
S28、每个处理器将步骤S27中收到的第二矩阵分块中除了来自要发送处理器的第二矩阵分块外的(δ-1)个第二矩阵分块分别传送给相邻的处理器;
S29、各处理器Pi将保存到各自寄存器的第一矩阵分块与其收到的来自相邻处理器传送的第二矩阵的δ×(δ-1)个第二矩阵分块相乘,得到乘积矩阵C第i个分块的剩余的δ×(δ-1)个列子分块;
S30、则组合后,得到乘积矩阵CM×P中大小为m行p列的第i个矩阵分块Cm×p。
4.根据权利要求1所述的以摩尔图为拓扑结构的处理器的并行矩阵乘计算的方法,其特征在于,所述度为3,处理器的个数q=10。
5.一种以摩尔图为拓扑结构的处理器的并行矩阵乘计算的系统,其特征在于,所述系统包括若干个处理器,所述处理器之间以摩尔图为拓扑结构相连。
6.根据权利要求5所述的以摩尔图为拓扑结构的处理器的并行矩阵乘计算的系统,其特征在于,所述摩尔图的直径为2,度为3,处理器的个数为10个。
7.根据权利要求5所述的以摩尔图为拓扑结构的处理器的并行矩阵乘计算的系统,其特征在于,所述摩尔图的直径为2,度为7,处理器的个数为50个。
8.一种权利要求5所述的系统的扩展结构,其特征在于,包括若干个以摩尔图为拓扑结构的处理器的并行矩阵乘计算的系统,通过增加权利要求5所述的系统的度和直径而组成所述扩展结构。
9.根据权利要求8所述的系统的扩展结构,其特征在于,包括2个系统,每个系统中包括10个处理器,每个系统的摩尔图的直径为2,度为3;组成的扩展结构的度为4直径为3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210100920.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于DPI和SVM技术的网络流量识别系统及方法
- 下一篇:高效实用叠衣机