[发明专利]基于异构众核处理器的格点量子色动力学并行加速方法有效

专利信息
申请号: 201910750655.3 申请日: 2019-08-14
公开(公告)号: CN110516194B 公开(公告)日: 2021-03-09
发明(设计)人: 栾钟治;张增校;杨海龙;王锐 申请(专利权)人: 北京航空航天大学
主分类号: G06F17/16 分类号: G06F17/16;G06F15/80
代理公司: 北京永创新实专利事务所 11121 代理人: 冀学军
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于异构众核处理器的格点量子色动力学并行加速方法,该并行加速方法包括有:第一步对从核按照从核标识号进行位置划分,第二步将读取的数据信息按照四维空间的位置进行存储,第三步从核根据自身的位置标识从存储器中读取自身负责计算的格点数值;第四步对任意一个从核进行格点数值迭代更新,得到属于从核的更新后格点数值。本发明是一种针对申威26010异构众核处理器的并行化方法,充分利用了申威众核处理器之间独特的寄存器通信特性,增加了数据的复用性,减少了大量冗余数据。并行加速后与只在主核上运行相比,本发明方法使得性能提高了63倍。
搜索关键词: 基于 异构众核 处理器 量子 动力学 并行 加速 方法
【主权项】:
1.一种基于异构众核处理器的格点量子色动力学并行加速方法,其特征在于包括有下列步骤:/n步骤一,异构众核处理器的从核矩阵位置初始化;/n由于异构众核处理器中存在有多个从核,因此需要对从核按照从核标识号进行位置划分,并记录出每个从核的矩阵位置;/n从核集CPEs={cpe1,cpe2,…,cpeA}按照8×8的矩阵进行位置排序,得到从核集位置矩阵addCPEs,任意一个从核位置记为dp,q:/n /n步骤二,主核读取费米子场量和规范场量;/n步骤201,主核MPE读取数据信息,将读取的所有数据信息以集合形式表达为SPM={S1,S2,…,Sg,…,SG};/n步骤202,主核将所述的SPM={S1,S2,…,Sg,…,SG}数据信息中的费米子场量按读取的先后顺序存入一个8×8×8×8的格点矩阵DAAMPE中,并将DAAMPE保存到存储器中;/n /n 表示第一个数据信息S1在四维坐标点上的费米子场量值;表示S1的费米子场量;/n 表示第二个数据信息S2在四维坐标点上的费米子场量值;表示S2的费米子场量;/n 表示任意一个数据信息Sg在四维坐标点上的费米子场量值;表示Sg的费米子场量;/n 表示最后一个数据信息SG在四维坐标点上的费米子场量值;表示SG的费米子场量;/n步骤203,主核将所述的SPM={S1,S2,…,Sg,…,SG}数据信息中的规范场量按读取的先后顺序存入一个4×8×8×8×8的格点链接矩阵DBBMPE中,并将DBBMPE保存到存储器中;/n /n 表示第一个数据信息S1在四维坐标点方向上的规范场量值;表示S1在四维坐标点的方向;表示S1的规范场量;/n 表示第二个数据信息S2在四维坐标点方向上的规范场量值;表示S2在四维坐标点的方向;表示S2的规范场量;/n 表示任意一个数据信息Sg在四维坐标点方向上的规范场量值;表示Sg在四维坐标点的方向;表示Sg的规范场量;/n 表示最后一个数据信息SG在四维坐标点方向上的规范场量值;表示SG在四维坐标点的方向;表示SG的规范场量;/n步骤三,从核基于自身的行号列号读取数据信息实现数据分割;/n步骤301,任意从核cpeA依据步骤一的从核矩阵位置dp,q,按照Z轴、T时间轴方向将DAAMPE矩阵中cpeA负责的数据信息部分读入局部存储空间,记为则所有从核读入的数据信息可记为:/n /n步骤302,任意从核cpeA依据步骤一的从核矩阵位置dp,q,按照Z轴、T时间轴方向将DBBMPE矩阵中cpeA负责的数据信息部分读入局部存储空间,记为则所有从核读入的数据信息可记为:/n /n步骤四,对任意一个从核中任意一个格点的数据信息进行运算;/n步骤401,任意一个从核cpeA从对应的获取Sg对应的格点费米子场量;执行步骤403;/n步骤402,任意一个从核cpeA从对应的获取Sg对应的规范场量;执行步骤403;/n步骤403,从任意一个格点的数据信息Sg的x,y,z,t四个维度获取相邻8个格点的数据信息,然后获取相邻8个格点的格点费米子场量和规范子场量;执行步骤404;/n相邻8个格点的数据信息分别记为S1、S2、S3、S4、S5、S6、S7和S8,位于相邻8个格点的中心格点是Sg,则格点费米子场量分别记为所述Sg的格点费米子场量记为/n则规范场量分别记为/n步骤404,将相邻8个格点的费米子场量和规范子场量进行矩阵相乘;执行步骤405;/n /n /n /n /n /n /n /n /n步骤405,以相邻8个格点的矩阵相乘量更新中心格点是Sg的格点费米子场量,更新后属于Sg的格点费米子场量,记为中的数据信息Sg被更新为执行步骤五;/n步骤五,每个从核对其局部存储空间中的每个格点的数据信息都进行步骤四的并行处理,从而得到更新后的所有格点的费米子场量,即获得执行步骤六;/n步骤六,更新完成后,迭代次数加1;并计算格点费米子场量的残差值;/n在本发明中,迭代次数记为U,最大迭代次数记为Umax,且Umax取值为1000,当前迭代次数记为U当前;若U当前<Umax,则执行步骤四;若U当前≥Umax,则执行步骤七;/n在本发明中,格点费米子场量的残差记为R,格点费米子场量的残差阈值记为Rmin,且Rmin的取值为1.0×10-12;若R>Rmin,则执行步骤四;若R≤Rmin,则执行步骤七;/n步骤七,将更新完成后的格点矩阵输出给存储器,作为文件保存;/n在本发明中,将传给存储器,更新DAAMPE得到保存并写入文件。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910750655.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top