[发明专利]一种基于GPU的消除云方程并行求解过程中数据相关的方法有效
申请号: | 201110382028.2 | 申请日: | 2011-11-25 |
公开(公告)号: | CN102508820A | 公开(公告)日: | 2012-06-20 |
发明(设计)人: | 廖湘科;杨灿群;石志才;王锋;易会战;黄春;赵克佳;陈娟;吴强 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/11 | 分类号: | G06F17/11 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 郭敏 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gpu 消除 方程 并行 求解 过程 数据 相关 方法 | ||
技术领域
本发明涉及计算机高性能计算领域消除云方程并行求解过程中存在的数据相关的方法,尤指利用GPU中的SIMT体系结构消除云方程并行求解过程中存在的数据相关的方法。
背景技术
CUDA(Compute Unified Device Architecture)是NVIDIA推出的在其GPU(Graph Processing Unit)上进行通用计算的一种开发环境和软件体系。运行在GPU上的程序称为kernel(内核函数),其中kernel中线程以grid(线程网格)为形式组织,每个grid由若干个block(线程块)组成,而每个block又由若干个Thread(线程)组成,其中grid和block均为线程所构成的三维结构。当kernel被调度执行时,则触发对应的grid中的线程在多个SMs(Streaming Multiprocessors,流处理器)进行并行处理。CUDA所采用的是一种叫SIMT(Single-Instruction,Multiple-Thread)的体系结构,当多个线程在SM上并发执行时,每32个连续的线程组成一个线程束warp,作为SM管理、调度、执行线程时最基本的并行单元,也就是说在SIMT的体系结构下每个warp中的32个线程执行时在同一时刻所获得的指令是相同的。共享内存(shared memory)是GPU片内的高速存储器,是一块可以被同一block内所有线程访问的可读写存储器。全局内存(global memory)则位于显存,CPU、GPU都可以进行读写访问,但访存速度要远低于共享内存。
相对论强度的激光脉冲与等离子体的相互作用在多种研究领域具有广泛的应用前景。粒子云方程是模拟过程中计算十分复杂的一个过程,在三维模拟的情况下,每个带电粒子受力于当前的电磁场环境而产生运动,从而引起周围电流密度的变化,在下一步的模拟中,这一变化又将重新作用于粒子的运动。在模拟过程中,整个模拟区域被划分成若干个大小相等的网格(Cell),作为模拟电磁场变化的基本单位。当某个网格中某个粒子运动时,就会对周边包括自己所属网格在内的27(3×3×3)个网格的电流密度值产生影响。这里称该粒子对某一(些)网格电流密度值的影响量为对这一(些)网格电流密度的贡献值,而周边受这一(些)网格影响的网格称为这一(些)网格的影子区域,其中这一(些)网格也受自己影响,故也属于自己的影子区域。当同时并行处理多个网格时,相邻网格的影子区域可能有相互重叠的情况,这样就会在更新这些影子区域电流密度值时产生一个冲突。也就是说,在GPU对更新模拟区域内网格的电流密度值的过程进行并行处理时,多个线程处理相邻网格中粒子时,这些粒子就可能需要同时向重叠的影子区域累加自己的贡献值。这样,多个线程之间就可能会对同一内存区域进行读写,从而产生对该内存的一个数据相关,即当某个线程读取一个网格当前电流密度值后,另一线程对同一网格的电流密度值进行了更新,而前者并不得知这一过程,在其计算完成后又对这一网格的电流密度值进行更新,直接覆盖了后者的更新值。因此,需对该过程中的内存访问进行一定的同步处理以消除多线程之间的数据相关,否则将得到错误的累加结果。目前化解多线程之间的数据相关的方法有以下几种:
(1)使用原子操作中的锁机制来控制多个线程对同一内存地址的访问。使得每个线程对某一网格电流密度旧值的读和新值的写在一个连续的时间段内完成,防止其他线程在该时间段内对这个网格电流密度值的访问,从而避免写后读的错误发生。但锁的使用对程序性能的影响十分可观,特别是在GPU的平台上,对锁的判断将严重阻塞大量线程的并行执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110382028.2/2.html,转载请声明来源钻瓜专利网。