[发明专利]基于新神威处理器的主从核协同计算编程框架有效
申请号: | 201610439755.0 | 申请日: | 2016-06-20 |
公开(公告)号: | CN106095583B | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | 乔方利;赵伟;尹训强;宋振亚 | 申请(专利权)人: | 国家海洋局第一海洋研究所 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F15/173 |
代理公司: | 北京一格知识产权代理事务所(普通合伙)11316 | 代理人: | 滑春生,赵永伟 |
地址: | 266061 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于新神威处理器的主从核协同计算编程框架,该基于新神威处理器包含4个核组(CG),核组之间通过片上网络链接,每个核组包含一个管理单元(MPE)和64个计算单元(CPE),每个核组拥有独立的内存空间,管理单元和计算单元通过一个内存控制器(MC)访问内存空间;各处理器之间通过系统接口(SI)建立联系,其特征在于,把新神威处理器的多个核组作为多个独立的线程使用,与管理单元(MPE)或主CPU共同完成相应的计算,基于利用局部内存(LDM)、主存、寄存器通信协同实现高效的MPE与CPE之间及CPE之间同步代替OpenACC的fork/join,能够更有效地利用新神威处理器设计的MPE和CPE计算资源。 | ||
搜索关键词: | 基于 神威 处理器 主从 协同 计算 编程 框架 | ||
【主权项】:
一种基于新神威处理器的主从核协同计算编程系统,该新神威处理器包含4个核组(CG),核组之间通过片上网络链接,每个核组包含一个管理单元(MPE)和64个计算单元(CPE),每个核组拥有独立的内存空间,管理单元和计算单元通过一个内存控制器(MC)访问内存空间;各处理器之间通过系统接口(SI)建立联系,其特征在于,把新神威处理器的多个核组作为多个独立的线程使用,与管理单元(MPE)共同完成相应的计算,基于利用从核的局部内存(LDM)、核组共用的主存、从核的寄存器通信协同实现管理单元(MPE)与计算单元(CPE)之间及计算单元(CPE)之间同步代替基于OpenACC接口的拆分/合并(Fork/Join)的编程框架,能够利用新神威处理器设计的管理单元(MPE)和计算单元(CPE)计算资源;管理单元(MPE)与计算单元(CPE)之间的协同计算包括:步骤(1):上层的信息传递应用程序接口(MPI)的并行计算与计算通信重叠;步骤(2):管理单元(MPE)、计算单元(CPE)多线程任务分配;所述的步骤(1)的具体方法:将每个众核处理器的一个核组作为1个信息传递应用程序接口(MPI)进程,基于信息传递应用程序接口(MPI)技术实现模式的大规模并行计算;通过地理空间的网格划分,将计算任务均衡地分配到每个进程;对信息传递应用程序接口(MPI)并行分区的每个分块,模式网格点包括内区和外区两部分,内区的计算不依赖于信息传递应用程序接口(MPI)交换,外区的计算需要等待信息传递应用程序接口(MPI)交换的结果,该分区的外区的上一步的计算结果需要通过信息传递应用程序接口(MPI)发送给邻区,而外区的计算也需要从邻区接收上一步的计算结果,所需接收的计算点记为halo区;在协同计算过程中,在管理单元(MPE)上对外区的变量通过信息传递应用程序接口(MPI)的非阻塞式发送(ISEND)函数发送给邻区,通过非阻塞式接受(IRECV)函数接收邻区的数据,实现halo区的数据交换。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家海洋局第一海洋研究所,未经国家海洋局第一海洋研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610439755.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种虚拟现实系统
- 下一篇:一种自锁机构及具有该自锁机构的光伏板清洗设备