[发明专利]异构众核架构中有限差分算法的优化方法有效

专利信息
申请号: 201610320899.4 申请日: 2016-05-13
公开(公告)号: CN106020773B 公开(公告)日: 2018-09-18
发明(设计)人: 许瑾晨;张乾坤;郝鑫;单征;戴涛;周蓓;郭绍忠 申请(专利权)人: 中国人民解放军信息工程大学;中国南方电网有限责任公司电网技术研究中心;南方电网科学研究院有限责任公司
主分类号: G06F9/30 分类号: G06F9/30;G06F9/38
代理公司: 郑州大通专利商标代理有限公司 41111 代理人: 陈大通
地址: 450000 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于高性能计算技术领域,具体的涉及一种异构众核架构中有限差分算法的优化方法,在基于众核加速器(MIC)与多核通用处理器(CPU)相结合的混合异构高性能计算机系统中,对有限差分算法使用三步递进优化法进行优化:主要包括基本优化法、并行优化法和异构协同优化法。本发明的有益效果是:应用三步递进优化法解决有限差分算法从多核系统到异构众核系统时由跨越式访存、可并行执行绪不足带来的计算性能低、并行效果差的问题,是一种具有高效性、可扩展性的优化方法,通过分支消除、循环展开、不变量外提等基本优化法削减计算强度并为向量化扫除障碍;通过分析数据依赖,循环分块,使用向量指令集改写核心算法等并行优化法,充分利用众核处理器多线程、长向量的机制。
搜索关键词: 异构众核 架构 有限 算法 优化 方法
【主权项】:
1.一种异构众核架构中有限差分算法的优化方法,其特征在于:有限差分算法采用三步递进优化法进行优化,所述三步递进优化法的具体步骤为:步骤一、基本优化,提取循环不变量削减计算强度、消除循环分支以利于向量化;步骤二、并行优化,采用OpenMP并行模型,通过在核心循环前加入编译指示,实现线程级并行,采用内建向量指令改写核心循环,实现指令级并行;步骤三、异构协同优化,在异构众核平台下,使用offload分载模式可以将部分计算从CPU端分载至MIC端;所述步骤二具体为:通过分析数据依赖,使用内建向量指令改写算法,进行循环分块,然后使用OpenMP并行模型,使多线程执行算法时具有更好的空间局部性,同时,使用内建向量指令并插入数据预取指令,有效缩短计算单元等待数据传输的时间;所述内建向量的具体步骤为:步骤201:将X维循环for(x=xx;x
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军信息工程大学;中国南方电网有限责任公司电网技术研究中心;南方电网科学研究院有限责任公司,未经中国人民解放军信息工程大学;中国南方电网有限责任公司电网技术研究中心;南方电网科学研究院有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610320899.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

tel code back_top