[发明专利]适合分布式并行计算的PBiCOR方法在审

申请号：	201510411590.1	申请日：	2015-07-14
公开（公告）号：	CN105045565A	公开（公告）日：	2015-11-11
发明（设计）人：	张理涛;张国辉;周永卫;武大勇;刘敬怀;张炎	申请（专利权）人：	郑州航空工业管理学院
主分类号：	G06F9/38	分类号：	G06F9/38;G06F9/54
代理公司：	北京风雅颂专利代理有限公司 11403	代理人：	李阳
地址：	450015 河***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明适合分布式并行计算的PBiCOR方法，有效解决了分布式存储并行机全局通讯互相影响的问题；其方案是，假设并行机具有P台处理机，每台处理机分别具有局部存储模块和相应的处理单元，处理单元之间通过互联网相连；假定采用SPMD模型，即所有的处理单元执行相同的程序，且一个处理单元需要远程处理单元的数据时，必须通过消息传递完成；本发明实现全局通讯次数减少，使得PBiCOR方法的并行通讯性能得到了有效提升，具有更好的并行性和扩展性，提高了通讯性能改进比率，势必为油藏模拟、天气预报、计算流体力学、计算电磁学、天体物理和惯性约束聚变（ICF）二维数值模拟等领域提供了理论基础。
搜索关键词：	适合分布式并行计算 pbicor 方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

适合分布式并行计算的PBiCOR方法，其特征在于，假设并行机具有P台处理机，每台处理机分别具有局部存储模块和相应的处理单元，处理单元之间通过互联网相连；假定采用SPMD模型，即所有的处理单元执行相同的程序，且一个处理单元需要远程处理单元的数据时，必须通过消息传递完成；P为处理器台数，N为稀疏矩阵A的维数，n_z为矩阵A每行(列)非零元素的平均个数，t_fl为一个浮点操作的时间，t_s为一个消息启动时间，t_w为一个字在两台处理器间传递所需的时间，一个内积或一个向量校正的计算时间为2t_flN/P，其中N/P为分配给每个处理器的未知量个数，(2n_z‑1)t_flN/P为稀疏矩阵向量乘积的计算时间；具有P台处理器的矩阵(或网状)分布式并行式，并假设通讯是二叉树方式进行的，则一个内积的整体聚集和广播的时间为2logP(t_s+t_w)，而同时聚集和广播K个内积的时间为2logP(t_s+kt_w)，稀疏矩阵已被映射到各处理器，使得矩阵向量乘积只需相邻处理器间的局部通讯，矩阵向量乘积所需的通讯是交换边界数据，即从其他处理器接收边界数据和向其他处理器发送边界数据，假设每个处理器必须接收和发送n_m个信息，每个处理器上有n_b边界数据单元个数，因此，每个处理器必须进行通讯的总字长为2(2n_b+n_m)；由于不需通讯，一个向量校正的时间为：t_{vec_upd}＝2t_flN/P (2)只需一次全局通讯的K个内积的时间为：t_{inn_prod}(k)＝2kt_flN/P+2logP(t_s+kt_w) (3)只需局部通讯的一个矩阵向量乘积的时间为：t_{mat_vec}＝(2n_z‑1)t_flN/P+2n_mt_s+2(2n_b+n_m)t_w (4)一个矩阵向量乘积的通讯时间为2n_mt_s+2(2n_b+n_m)t_w。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于郑州航空工业管理学院，未经郑州航空工业管理学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510411590.1/，转载请声明来源钻瓜专利网。

上一篇：一种用于制备高铁扣件用铁垫板的合金
下一篇：一种利用热榨花生粕制备葡萄糖苷酶抑制活性肽的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]适合分布式并行计算的PBiCOR方法在审

专利文献下载