[发明专利]高性能计算机系统中不满足计算精度要求的结点检测方法有效
申请号: | 201210041912.4 | 申请日: | 2012-02-23 |
公开(公告)号: | CN102646060A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 刘杰;迟利华;胡庆丰;徐涵;晏益慧;龚春叶;杨博;赵文闻 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 郭敏 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种高性能计算机系统中不满足计算精度要求的问题结点检测方法。技术方案是先选择基准测试程序并在高性能计算机全系统2n个计算结点上运行,如果计算精度达不到预定的要求,将高性能计算系统分成两个部分,分别加载基准测试程序,如果计算结点数目减半的并行程序计算结果仍不满足计算精度要求,则再将计算结点的数目减半,直到均满足计算精度要求,或者每个部分只剩下一个计算结点。若计算结点数为1但仍不满足计算精度要求,则说明已经找到不满足计算精度要求的计算结点。采用本发明可以对计算精度不满足要求的计算结点实现自动检测,定位问题结点,保证大规模高性能计算机系统的可用性。 | ||
搜索关键词: | 性能 计算机系统 不满足 计算 精度 要求 结点 检测 方法 | ||
【主权项】:
一种高性能计算机系统中不满足计算精度要求的结点检测方法,其特征在于包括以下步骤:第一步:选择基准测试程序,要求基准测试程序有标准计算结果,初始化结点集合H为空集;第二步:在高性能计算机全系统2n个计算结点上运行基准测试程序,n为正整数,将在高性能计算机系统上运行的计算结果和标准计算结果进行对比,若计算结果和标准结果一致,则满足计算精度要求,所有计算结点标记为正常,转第八步;否则说明计算精度达不到预定要求,将达不到预定要求的高性能计算系统结点放到结点集合H中,转第三步;第三步:将计算精度达不到预定要求的高性能计算系统结点集合H一分为二,分别记为集合H1和H2,H1和H2的计算结点数相等,转第四步;第四步:在H1和H2组成的计算机系统上分别加载基准测试程序,分为以下几种情况处理:4.1若并行程序在H1和H2组成的计算机系统上的计算结果均和标准结果一致,转第五步;4.2当并行程序在H1组成的计算机系统上的计算结果和标准结果一致时,将H1标记为正常结点,转第八步;当并行程序在H1组成的计算机系统上的计算结果和标准结果不一致时,若H1结点数目不为1,转第三步,若H1结点数为1,将H1中的计算结点标记为问题结点,转第八步;4.3当并行程序在H2组成的计算机系统上的计算结果和标准结果一致时,将H2标记为正常结点,转第八步;当并行程序在H2组成的计算机系统上的计算结果和标准结果不一致时,若H2结点数目不为1,转第三步,若H2结点数为1,将H2中的计算结点标记为问题结点,转第八步;第五步:将H1和H2的计算结点数记为2m,1≤m≤n‑1,分为两种情况处理:5.1当结点数2m等于2n‑1时,分别在H1和H2随机选择数目相等的结点进行互换,转第四步;5.2当结点数2m不等于2n‑1时,从标记为正常的计算结点中任取2m个结点组成集合H3;H1和H3相合并构成测试集合H13,H2和H3相合并构成测试集合H23;在 H13和H23组成的计算机系统上分别加载基准测试程序,如果H1和H2的结点数2m大于1,转第六步,如果H1和H2的结点数2m等于1,转第七步;第六步:分为以下四种情况处理:6.1并行程序在H13组成的计算机系统上计算结果和标准结果一致,将H1中的计算结点标记为正常结点,转第八步;6.2并行程序在H13组成的计算机系统上计算结果和标准结果不一致,将H1一分为二,两个部分还分别记为H1和H2,H1和H2的计算结点数相等,转第5.2步;6.3并行程序在H23组成的计算机系统上计算结果和标准结果一致,将H2中的计算结点标记为正常结点,转第八步;6.4并行程序在H23组成的计算机系统上计算结果和标准结果不一致,将H2一分为二,两个部分还分别记为H1和H2,H1和H2的计算结点数相等,转第5.2步;第七步:分为以下两种情况处理:7.1并行程序在H13组成的计算机系统上计算结果和标准结果一致,将H1中的计算结点标记为正常结点,转第八步;并行程序在H13组成的计算机系统上计算结果和标准结果不一致,将H1中的计算结点标记为问题结点,转第八步;7.2并行程序在H23组成的计算机系统上计算结果和标准结果一致,将H2中的计算结点标记为正常结点,转第八步;并行程序在H23组成的计算机系统上计算结果和标准结果不一致,将H2中的计算结点标记为问题结点,转第八步;第八步:将问题结点和正常结点输出,结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210041912.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种铝合金平开门窗导流板
- 下一篇:一种铝合金不锈钢复合型材门