[发明专利]一种基于GPU端的有限元刚度矩阵模拟方法有效
申请号: | 201811439272.6 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109753682B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 童哲铭;高杰;童水光 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F30/23 | 分类号: | G06F30/23;G06F119/14 |
代理公司: | 杭州天昊专利代理事务所(特殊普通合伙) 33283 | 代理人: | 何碧珩 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gpu 有限元 刚度 矩阵 模拟 方法 | ||
本发明提供一种基于GPU端的有限元刚度矩阵模拟方法,包括:建立刚度方程Ax=b并初始化;分裂处理刚度矩阵A;对应分配GPU显存;将CPU端初始化数据复制到GPU上;调用计时函数开始计时;调用设备端多项式预优共轭梯度算法进行计算;将计算结果从GPU上复制回CPU端;释放CPU与GPU显存。本发明基于NVIDIA CUBLAS库以及CUDA语言,结合对角预优的预处理方法的优点,对三对角刚度矩阵先进行了一种较好的分裂,避免了对矩阵的求逆运算,从而大大减少了共轭梯度算法的运算量,从而在GPU上实现了刚度矩阵的多项式预处理。
技术领域
本发明属于有限元的数值模拟计算与计算机应用领域,涉及预优有限元刚度矩阵的加速求解实现。
背景技术
计算机图形处理单元(简称GPU)运用于通用计算的研究越来越多,特别是在大规模科学和计算领域,因为最初设计用于图形图像处理,所以GPU与生俱来就是一种拥有大量运算单元的并行处理器,并且由GPU提供相同的计算能力,所需要的成本和功耗都要小于基于CPU的系统。
作为一种数值模拟与仿真的基本方法,有限元法以其高度的适应性,成为现代工程设计和结构分析的重要方法之一,并在土木、水利、汽车、机械、航空航天、核工业和大地勘测等众多领域应用广泛。随着科学技术的不断发展,工程问题的规模和复杂程度相应提高,也对有限元计算提出更大规模、更快速度的要求。有限元法的基本思想是“化整为零,积零为整”,与并行计算技术的“分而治之”的基本原则相协调。因此,对于大规模的有限元结构分析,研究基于GPU的加速计算方法具有重要意义。其中,刚度矩阵的求解是加速计算的核心技术。
目前,基于矩阵不完全分解预处理的共轭梯度算法在GPU上的实现加速的研究成果相对较多。例如针对该算法中的三角刚度阵求解的串行性进行优化,采用分层调度的方法提高了其并行性。又如,基于对Krylov子空间方法的研究,在数据存储与迭代计算方面进行创新,实现了Krylov子空间方法的GPU加速实现。目前还有一些研究指出了稀疏刚度方程在GPU上的共轭梯度法求解,并结合空间桁架问题验证了CUDA平台GPU有限元计算的加速性。以及,针对CPU之上的向量内积计算时间问题,提出了一种GPU加速向量乘积的归约策略针对CPU之上的向量内积计算时间问题,提出了一种GPU加速向量乘积的归约策略,并基于OpenMP和MPI编程模型实现了加速计算。
但是,涉及多项式预处理的共轭梯度算法研究相对较少。现有的刚度方程求解采用的方法都是将其离散化为高阶线性方程组,从而将原有问题转化为高阶线性方程组的求解问题。共轭梯度算法作为迭代算法中最为有效的方法,深受研究者的关注。但是在具体实现过程中发现,只有当系数矩阵仅有少数几个互不相同的特征值或者非常良态时,共轭梯度算法才能收敛的非常之快。因此,采用预处理技术的共轭梯度算法在求解刚度方程中,具有很好的适用性。预处理技术一般采用不完全的Cholesky因子预优方法。这种方法虽然是一种非常重要的预优技巧,却也有着明显的缺点:该预优算法需要求解两个三角形方程组,并行效率非常低,无法充分利用GPU加速处理器的并行性能。多项式预优方法由于该算法中只包含矩阵的乘法计算和求逆计算,相对不完全的Cholesky分解预处理方法,具有更好的并行性能。然而求逆运算在具体实现过程中仍然是GPU加速计算的瓶颈。而且,即使是大规模的矩阵、向量的乘法运算,在CPU上实现多项式预优算法也会因为耗时巨大,而无法得到有效应用。
发明内容
本发明所要解决的技术问题是:针对现有对不完全分解法预处理技术的缺陷,以及对多项式预处理方法的研究不足,提供一种基于GPU端的有限元刚度矩阵模拟方法,本发明基于NVIDIA CUBLAS库以及CUDA语言,结合对角预优的预处理方法的优点,对三对角刚度矩阵先进行了一种较好的分裂,避免了对矩阵的求逆运算,从而大大减少了共轭梯度算法的运算量,从而在GPU上实现了刚度矩阵的多项式预处理。
本发明解决上述技术问题所采用的技术方案是:
一种基于GPU端的有限元刚度矩阵模拟方法,包括以下步骤,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811439272.6/2.html,转载请声明来源钻瓜专利网。