[发明专利]基于神威架构的三维应变仿真PCG并行优化方法及系统有效
申请号: | 202210922499.6 | 申请日: | 2022-08-02 |
公开(公告)号: | CN114970294B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 潘景山;肖磊;田敏;杜伟;张赞军;刘弢 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G06F30/23 | 分类号: | G06F30/23;G06T17/20;G06F9/50 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神威 架构 三维 应变 仿真 pcg 并行 优化 方法 系统 | ||
1.基于神威架构的三维应变仿真PCG并行优化方法,其特征在于,该方法基于SW26010Pro处理器实现,包括如下步骤:
对弹性体三维应变仿真程序进行剖分,寻找程序中计算密集型算法部分;
所述对弹性体三维应变仿真程序进行剖分,寻找程序中计算密集型算法部分通过采用手动插桩的形式,在程序内部进行细粒度的热点分析;
将程序中计算密集型算法部分分割为多个计算任务,并行分发至一个或多个主核;主从核协同合作,将模型中的网格点分别分到不同的主核中,再由主核分配给其附属从核进行计算;程序中计算密集型算法部分通过MPI将计算任务以有限元的形式分发至主核,主核得到的有限元的数量就是算法中循环最外层的维度;
从核采用静态数组的形式接收分发的数据;
每个主核将任务对应的数据进行分割,将其分发给一个或多个从核进行并行计算;
从核将程序中计算密集型算法的迭代结果回传至主核。
2.根据权利要求1所述的基于神威架构的三维应变仿真PCG并行优化方法,其特征在于,从核进行计算时,采用双缓冲优化策略,在局部定义两个等同的数据数组,形成输出双缓冲,在本次计算中同时将上次计算的结果发回主存。
3.根据权利要求2所述的基于神威架构的三维应变仿真PCG并行优化方法,其特征在于,所述双缓冲优化策略具体包括当输入的是计算本轮次时,发起下个轮次的数据指令,当下一轮判断数据传到之后开始进行计算,接着发起下一轮次的数据传输指令,通过这种方案将计算与数据传输时间重叠。
4.根据权利要求1所述的基于神威架构的三维应变仿真PCG并行优化方法,其特征在于,从核采用DMA数据传输的形式访问主存。
5.根据权利要求1所述的基于神威架构的三维应变仿真PCG并行优化方法,其特征在于,从核进行并行计算时,采用向量化部件SWSIMD进行处理数据。
6.根据权利要求1所述的基于神威架构的三维应变仿真PCG并行优化方法,其特征在于,不同从核间采用RMA传输的通信方式进行消息传递。
7.基于神威架构的三维应变仿真PCG并行优化系统,其特征在于,包括:
算法搜索模块,用于对弹性体三维应变仿真程序进行剖分,寻找程序中计算密集型算法部分;所述对弹性体三维应变仿真程序进行剖分,寻找程序中计算密集型算法部分通过采用手动插桩的形式,在程序内部进行细粒度的热点分析;
任务分发模块,用于将程序中计算密集型算法部分分割为多个计算任务,并行分发至一个或多个主核;程序中计算密集型算法部分通过MPI将计算任务以有限元的形式分发至主核,主核得到的有限元的数量就是算法中循环最外层的维度;
从核采用静态数组的形式接收分发的数据;
数据分发模块,用于每个主核将任务对应的数据进行分割,将其分发给一个或多个从核进行并行计算;
数据回传模块,用于从核将程序中计算密集型算法的迭代结果回传至主核。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210922499.6/1.html,转载请声明来源钻瓜专利网。