[发明专利]异构众核处理器的任意带状线性方程组两级分区两次缩聚并行计算的方法及系统在审
申请号: | 201910629582.2 | 申请日: | 2019-07-12 |
公开(公告)号: | CN110347967A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 喻高远;金先龙;李俊杰;马志强;廖鹏 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/11 | 分类号: | G06F17/11;G06F15/173 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 两级 线性方程组 众核处理器 并行计算 缩聚 异构 分区 子区域 主核 分布式数据存储 分层通信 数据信息 同步访问 多文件 局部化 从核 存储 组装 通信 | ||
本发明涉及一种面向异构众核处理器的任意带状线性方程组两级分区两次缩聚并行计算方法,在实现分布式数据存储的基础上,通过两级分区两级缩聚实现分层通信,进而最大限度地实现局部化通信,无论初始子区域还是组装子区域的数据信息均可通过多文件流的方式存储在相应的各个核组主核上,各核组所属从核可同步访问主核数据进行计算,可充分利用国产SW26010异构众核处理器结构特点提升大规模任意带状线性方程组并行计算效率。
技术领域
本发明涉及一种并行任意带状线性方程组并行求解的技术领域,具体是一种面向国产SW26010异构众核处理器的任意带状线性方程组两级分区两次缩聚并行计算方法及系统。
背景技术
随着科学研究和工程技术的不断发展,出现了诸如跨江隧道、高速列车、摩天大厦等大型和超大型的复杂工程系统。这些系统不但自由度高,而且还含有非线性和复杂的边界条件等多种因素,因而需借助高性能计算完成其大规模有限元模型分析。高性能计算已成为继理论研究、科学实验之后的第三大科学手段,并且发挥的作用越来越重要。而高性能计算的重要组成部分为大规模任意带状线性方程组的并行求解,其并行效率依赖于高性能并行计算机的研究和开发相应的并行算法。
在高性能并行计算机方面,近年来,主流高性能并行计算机系统越来越多地采用异构众核架构,即通用处理器搭载众核加速设备,共同完成计算任务,如:AMD公司的APU项目、NVIDIA公司牵头的Echolen项目、Intel公司牵头的Runnemede项目、我国的“神威太湖之光”项目等,其典型特征是:位于同一核组内的不同处理器之间通过局部总线相连,通信速率很高;而位于不同核组之间的处理器通过高性能网络相连,通信速率相对较低。神威太湖之光”采用SW26010异构众核处理器,其峰值性能、持续性能、性能功耗比3项关键指标居于世界第一,相比计算能力,其访存能力偏弱,给大规模任意带状线性方程组并行求解的高效实现带来了巨大的挑战。如何利用SW26010异构众核处理器的结构特点开发出与之对应的任意带状线性方程组并行算法成为提高其求解并行效率的关键。
经对现有技术文献的检索发现,在任意带状线性方程组并行求解算法方面,主要分为两类:一类是将任意带状线性方程组看作普通稀疏矩阵或稠密矩阵,借由其并行求解方法进行求解,如:直接法和迭代法;另一类是从对角线性方程组自身的并行性出发,借助“分而治之”的策略进行并行求解。采用直接法和迭代法对任意带状线性方程组进行求解时,无法发挥对角线性方程组自身的并行性优势,故而导致进程间通信和同步开销的增加,致使任意带状线性方程组求解的并行效率极大地降低。采用“区域分解”的策略对任意带状线性方程组进行求解时,可充分发挥其自身的并行性优势,与直接法和迭代法相比,具有更高的并行效率。然而,目前有关对角线性方程组基于“区域分解”策略的并行求解方法研究内容主要为:三对角线性方程组和五对角线性方程组的并行求解,国内外尚无任意带状线性方程组并行求解的相关研究。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种异构众核处理器的任意带状线性方程组两级分区两次缩聚并行计算的方法及系统。
根据本发明提供的一种异构众核处理器的任意带状线性方程组两级分区两次缩聚并行计算的方法,包括如下步骤:
S1,经分区软件将任意带状线性方程组数据剖分为N个初始子区域,并将每个初始子区域的方程组系数和方程右端项单独保存于一个文件中,其中N为单个核组的整数倍;
S2,各核组主核并行读取所述初始子区域的系统方程数据,并将各初始子区域的系统方程数据传递给相应的从核,各核组从核同步单独形成每个初始子区域的系统方程,经缩聚消去每个初始子区域内部变量,得到仅与边界变量相关的各初始子区域的界面方程;
S3,各核组主核通过组集位于同一核组内的所有底层初始子区域界面方程形成各顶层组装子区域的系统方程,经缩聚消去每个组装子区域的内部变量,得到仅与边界变量相关的各顶层组装子区域的界面方程;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910629582.2/2.html,转载请声明来源钻瓜专利网。