[发明专利]以摩尔图为拓扑结构的并行矩阵乘计算的方法和系统无效
申请号: | 201210100920.1 | 申请日: | 2012-04-09 |
公开(公告)号: | CN102737010A | 公开(公告)日: | 2012-10-17 |
发明(设计)人: | 张冰;昝程 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 深圳市君胜知识产权代理事务所 44268 | 代理人: | 刘文求;杨宏 |
地址: | 518054 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摩尔 拓扑 结构 并行 矩阵 计算 方法 系统 | ||
技术领域
本发明涉及并行与分布式计算技术领域,特别涉及一种以摩尔图为拓扑结构的并行矩阵乘计算的方法和系统。
背景技术
大多数并行计算都是在基于总线、环和二维环绕网孔阵列、立方体、完全树等拓扑结构构造的超级计算机或分布式网络上实现的,数据加载过程中的通信开销占据了整个计算过程很大一部分开销,例如矩阵乘运算。
现有的矩阵乘计算经常采用Canon和Fox这两种基于二维环绕网孔阵列拓扑结构的并行处理技术,其基本过程包括装入、对准、循环单步移位和乘加3个步骤。装入是将用于进行乘运算的矩阵A,B按棋盘方式进行分块,然后按一定的规定将各个分块矩阵ai,j,bi,j加载到处理器Pi,j中。在装入过程中对数据装载的位置要求严格,要求数据必须在所规定的位置上。
在对准步骤上,Canon方法是将矩阵分块ai,j向左循环移动i步,将矩阵分块bi,j向上循环移动j步。Fox技术是将对角矩阵分块ai,j向所在行的其余处理器进行一到多播送。装入和对准两个步骤占据了Canon和Fox模块的很大一部分通信开销。这些开销是由于所采用的处理机互联拓扑结构的局限性所造成的。此外,扩展性也是一个比较大的问题,即计算效率往往会随着计算规模的增大而下降。
摩尔图是指在一定度和直径下包含最多节点的图,图中的节点连接成最稠密的形式,具有对称对等和节点之间整体通信开销最小的特点。直径为2的摩尔图的节点数n与图的度δ的关系为:n = δ2+1。图1和图2分别为直径为2,度为3和直径为2,度为7的两个摩尔图。
对摩尔图的研究主要集中在图论领域,基于摩尔图的应用也主要是在通信网络路由的设计方面,而如何采用摩尔图作为处理器互联的拓扑结构进行并行计算的文献和报道则较为鲜见。
有鉴于此,现有技术还有待改进和提高。
发明内容
本发明的目的在于提供一种以摩尔图为拓扑结构的并行矩阵乘计算的方法和系统,以解决现有技术的并行矩阵乘计算中,装入和对准两个步骤占据了很大一部分通信开销,处理效率低下,不易扩展等问题。
为了达到上述目的,本发明采取了以下技术方案:
一种以摩尔图为拓扑结构的处理器的并行矩阵乘计算的方法,用于对第一矩阵AM×N和第二矩阵BN×P进行相乘计算,使其得到乘积矩阵CM×P,其中,所述摩尔图的直径为2,度为δ,处理器的个数q=δ2+1,其中,所述方法包括以下步骤:
S1、将第一矩阵AM×N按行分解为q个每个大小为m行N列的第一矩阵分块,将第二矩阵BN×P按列分解为q个每个大小为N行p列的第二矩阵分块;其中,m=M除以q,p=P除以q;
S2、每个处理器Pi随机地接收一个第一矩阵分块和一个第二矩阵分块,完成乘积矩阵CM×P中大小为m行p列的第i个分块Cm×p的计算;
S3、将乘积矩阵分块Cm×p叠加在一起,组成乘积矩阵CM×P。
所述的以摩尔图为拓扑结构的处理器的并行矩阵乘计算的方法,其中,在所述步骤S1中,通过对第一矩阵AM×N和第二矩阵BN×P添加若干值为0的行和列,确保m、p的值为整数。
所述的以摩尔图为拓扑结构的处理器的并行矩阵乘计算的方法,其中,所述步骤S2进一步包括:
S21、每个处理器随机地接收一个第一矩阵分块和一个第二矩阵分块;
S22、每个处理器将分配给自己的1个第一矩阵分块传送给相邻的δ个处理器;
S23、每个处理器Pi收到来自相邻处理器传送的δ个第一矩阵分块后,检查其中及本身初始分配的第一矩阵分块中是否有第一矩阵的第i个矩阵分块,若有则保存到处理器相应的寄存器中,若无则进行步骤S24;
S24、每个处理器将步骤S24中收到的第一矩阵分块中除了来自要发送处理器的第一矩阵分块外的(δ-1)个第一矩阵分块分别传送给相邻的处理器;
S25、每个处理器Pi收到来自相邻处理器传送的δ×(δ-1)个第一矩阵分块后,检查其中是否有第一矩阵的第i个矩阵分块,若有则保存到处理器相应的寄存器中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210100920.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于DPI和SVM技术的网络流量识别系统及方法
- 下一篇:高效实用叠衣机