[发明专利]一种面向多核向量处理器的格子玻尔兹曼优化方法有效

专利信息
申请号: 202011037166.2 申请日: 2020-09-28
公开(公告)号: CN112100099B 公开(公告)日: 2021-06-08
发明(设计)人: 刘宗林;龚国辉;夏一民;徐雪刚;寻迎亚;李肖;郭艳芳;李春江 申请(专利权)人: 湖南长城银河科技有限公司
主分类号: G06F13/28 分类号: G06F13/28;G06F30/23
代理公司: 长沙市护航专利代理事务所(特殊普通合伙) 43220 代理人: 莫晓齐
地址: 410008 湖南省长沙市高新*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 多核 向量 处理器 格子 玻尔兹曼 优化 方法
【说明书】:

发明公开了一种面向多核向量处理器的格子玻尔兹曼优化方法,包括以下步骤:S100、通过设定的预取、计算和写回三个状态针对芯片内核的向量访存部件进行数据传输时间隐藏的设计;S200、设计基于表面切割的复杂标量程序的向量化方法,以及面向基于向量的快速指数算法,并使用改进的三维格子玻尔兹曼方法进行验证实例验证,实现效率提升;S300、基于单核的验证流程自适应到多核,实现快速并行计算。相比现有技术,很好地解决了向量的并行运算的问题,缓解了DMA带宽低导致的时延长,实现了指数运算的高度向量并行计算。

技术领域

本发明属于高性能计算领域,具体涉及一种面向多核向量处理器的格子玻尔兹曼优化方法。

背景技术

围绕高性能自主加速器关键技术展开研究是各国超级计算的热潮。多核向量处理器高性能计算的难点主要体现在:设计多核向量的并行算法难;数据量大且DDR访存带宽低延时长;exp等库函数缺乏高度并行的向量化版本。在算法程序进行向量计算时,需要先把数据从DDR读入到核内向量地址空间(AM),才能进行计算。DDR的存储空间大,但读写速度明显慢于AM,降低了运行效率。

格子玻尔兹曼方法(LBM,Lattice Boltzmann Method)是一种应用于计算流体动力学的数值仿真方法。它基于量子统计力学的理论,将流体看做大量有质量无体积的微粒,可以通过统计这些微粒的碰撞规律来描述流体的真实流动。格子玻尔兹曼方法主要由格子(离散速度模型)、平衡态分布函数、分布函数的演化方程组成,采用不同的格子、平衡态分布函数以及演化方程,一般便能解决各式各样的流体问题。LBM适合并行运算,但计算机求解流体流动过程中LBM用到取模操作,在转化成向量运算时,取模操作会使得读取数据不连续,难以并行化处理,降低了计算效率。求指数(exp)的原理是通常利用泰勒展开式,存在大量的除法运算,同时,当变量为负数时,泰勒公式中的n需要取很大的值,才能获得较精确的结果,两者都延长了计算时间。

发明内容

本发明提供一种面向多核向量处理器的格子玻尔兹曼优化方法,用以解决现有技术中向量并行算法效率低,数据量大,DDR访存时间长,exp等向量库函数并行度低,导致计算效率低等问题。

本发明的目的通过以下技术方案实现:提供一种面向多核向量处理器的格子玻尔兹曼优化方法,包括以下步骤:

S100、通过设定的预取、计算和写回三个状态针对芯片内核的向量访存部件进行数据传输时间隐藏的设计;

S200、设计基于表面切割的复杂标量程序的向量化方法,以及面向基于向量的快速指数算法,并使用改进的三维格子玻尔兹曼方法进行验证实例验证,实现效率提升;

S300、基于单核的验证流程自适应到多核,实现快速并行计算。

作为进一步的改进,所述步骤S100具体表现为:根据设定的预取、计算和写回三个状态依次轮换,将DDR数据读写时间隐藏在DSP计算过程,实现对芯片内核的向量访存部件的访存延迟隐藏。

作为进一步的改进,所述步骤S200中使用改进的三维格子玻尔兹曼方法进行验证实例具体按照体-面-边-点的维度分别进行向量计算,从而消除标量的取模操作。

作为进一步的改进,所述按照体-面-边-点的维度分别进行向量计算,从而消除标量的取模操作过程分解为如下步骤:

S201A、计算腔体内部,即计算非固壁网格点;

S202A、计算6个面的内部:先计算6个面内部的网格点,再计算网格点的数据碰撞和迁移;

S202A、计算6个面的交线:通过VLR向量长度寄存器相关函数,设置好需要计算的向量单元长度,再进行各交线上网格点的数据碰撞和迁移;

S204A、计算各条线的交点:设置VLR长度为1,然后通过VLR向量长度寄存器相关函数,设置好需要计算的向量单元长度,再进行各交点上网格点的数据碰撞和迁移。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南长城银河科技有限公司,未经湖南长城银河科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011037166.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top