[发明专利]适合分布式并行计算的PBiCOR方法在审
申请号: | 201510411590.1 | 申请日: | 2015-07-14 |
公开(公告)号: | CN105045565A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | 张理涛;张国辉;周永卫;武大勇;刘敬怀;张炎 | 申请(专利权)人: | 郑州航空工业管理学院 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F9/54 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 李阳 |
地址: | 450015 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适合分布式并行计算的PBiCOR方法,有效解决了分布式存储并行机全局通讯互相影响的问题;其方案是,假设并行机具有P台处理机,每台处理机分别具有局部存储模块和相应的处理单元,处理单元之间通过互联网相连;假定采用SPMD模型,即所有的处理单元执行相同的程序,且一个处理单元需要远程处理单元的数据时,必须通过消息传递完成;本发明实现全局通讯次数减少,使得PBiCOR方法的并行通讯性能得到了有效提升,具有更好的并行性和扩展性,提高了通讯性能改进比率,势必为油藏模拟、天气预报、计算流体力学、计算电磁学、天体物理和惯性约束聚变(ICF)二维数值模拟等领域提供了理论基础。 | ||
搜索关键词: | 适合 分布式 并行 计算 pbicor 方法 | ||
【主权项】:
适合分布式并行计算的PBiCOR方法,其特征在于,假设并行机具有P台处理机,每台处理机分别具有局部存储模块和相应的处理单元,处理单元之间通过互联网相连;假定采用SPMD模型,即所有的处理单元执行相同的程序,且一个处理单元需要远程处理单元的数据时,必须通过消息传递完成;P为处理器台数,N为稀疏矩阵A的维数,nz为矩阵A每行(列)非零元素的平均个数,tfl为一个浮点操作的时间,ts为一个消息启动时间,tw为一个字在两台处理器间传递所需的时间,一个内积或一个向量校正的计算时间为2tflN/P,其中N/P为分配给每个处理器的未知量个数,(2nz‑1)tflN/P为稀疏矩阵向量乘积的计算时间;具有P台处理器的矩阵(或网状)分布式并行式,并假设通讯是二叉树方式进行的,则一个内积的整体聚集和广播的时间为2logP(ts+tw),而同时聚集和广播K个内积的时间为2logP(ts+ktw),稀疏矩阵已被映射到各处理器,使得矩阵向量乘积只需相邻处理器间的局部通讯,矩阵向量乘积所需的通讯是交换边界数据,即从其他处理器接收边界数据和向其他处理器发送边界数据,假设每个处理器必须接收和发送nm个信息,每个处理器上有nb边界数据单元个数,因此,每个处理器必须进行通讯的总字长为2(2nb+nm);由于不需通讯,一个向量校正的时间为:tvec_upd=2tflN/P (2)只需一次全局通讯的K个内积的时间为:tinn_prod(k)=2ktflN/P+2logP(ts+ktw) (3)只需局部通讯的一个矩阵向量乘积的时间为:tmat_vec=(2nz‑1)tflN/P+2nmts+2(2nb+nm)tw (4)一个矩阵向量乘积的通讯时间为2nmts+2(2nb+nm)tw。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州航空工业管理学院,未经郑州航空工业管理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510411590.1/,转载请声明来源钻瓜专利网。