[发明专利]一种多维循环自动向量化分块因子分块方法及装置有效

专利信息
申请号: 202010706144.4 申请日: 2020-07-21
公开(公告)号: CN111857727B 公开(公告)日: 2021-07-13
发明(设计)人: 刘松;伍卫国;柴晓菲;屈彬;马洁 申请(专利权)人: 西安交通大学
主分类号: G06F8/41 分类号: G06F8/41
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 陈翠兰
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多维 循环 动向 量化 分块 因子 方法 装置
【说明书】:

发明公开了一种多维循环自动向量化分块因子分块方法及装置,对已进行常规分块的循环代码识别可向量化循环层,为可向量化循环层选择分块因子,为可向量化循环层选择分块因子使得循环体中所有可向量化数据的数目最大,将可向量化循环层的分块因子进行调整,以优化程序并行性和局部性为目标,通过数学规划的方法计算和调整其他循环层的分块因子,针对具有病态规模的循环较现有方法可以获得更好的程序加速比,同时具有良好的可扩展性,本发明通过为可向量化循环层选择合理的分块因子,增强数据的对齐性,增加可向量化数据的数目,从而使程序在向量处理器上获得更好的性能。

技术领域

本发明属于编译优化领域,特别涉及一种多维循环自动向量化分块因子分块方法及装置。

背景技术

在计算密集型应用程序中,特别是科学和工程计算应用程序,循环嵌套计算会耗费大部分的运行时间,称为亟待解决的程序热点。处理器计算程序的循环分块是一种应用广泛的循环优化技术,通过仿射变换对程序计算的嵌套循环部分进行代码转换,一方面增加程序的数据局部性,降低cache失效率;另一方面开发循环代码的粗粒度并行性,充分利用多核处理器的计算性能。分块后的循环迭代根据分块因子大小重置访存顺序,从而减小数据重用距离。因此,分块因子大小的选择对循环分块代码的性能有着重要的影响。近年来,随着SIMD扩展部件在微处理器和协处理器中的发展,向量寄存器的位数逐渐增加,使得自动向量化技术在开发嵌套循环的细粒度并行性方面得到有效提高。但是,循环分块的分块因子大小选择不仅影响处理器程序的局部性,也影响程序的自动向量化收益,现有方法在开发多维(维度大于1)循环自动向量化过程中因数据不对齐易导致向量化收益低下,出现病态规模问题,从而降低了处理器的处理速度。因此,如何实现分块因子的有效循环分块,在保持程序访存局部性的同时充分利用向量化收益,对处理器计算程序性能的提高具有积极意义。

发明内容

本发明的目的在于提供一种多维循环自动向量化分块因子分块方法及装置,以克服现有方法在多维循环自动向量化过程中因数据不对齐导致向量化收益低下的问题。

为达到上述目的,本发明采用如下技术方案:

一种多维循环自动向量化分块因子分块方法,包括以下步骤:

步骤1)、对已进行常规分块的循环代码识别可向量化循环层;

步骤2)、为可向量化循环层选择分块因子;

步骤3)、以优化程序并行性和局部性为目标,通过数学规划的方法计算和调整其他循环层的分块因子,将可向量化循环层的分块因子调整为最佳分块因子,实现多维循环自动向量化分块因子分块。

进一步的,可向量化循环层是满足编译器自动向量化条件的循环层,满足编译器自动向量化条件包括迭代次数可数、所有数据共享相同的控制流和无条件分支。

进一步的,可向量化循环层包括嵌套循环中的最内层循环和单层循环。

进一步的,分块因子J的大小使得循环体中所有可向量化数据的数目最大。

进一步的,可向量化数据的数目为所有可向量化数据块中的数据个数。

进一步的,可向量化数据块为内存中连续的向量因子大小的数据,其第一个数据的地址对齐于向量寄存器。

进一步的,设可向量化循环层访问的数组最后一维的长度为W,向量因子为V,遍历所有的分块因子J,V≤J≤W,并计算对应的可向量化数据的数目值,取使得可向量化数据的数目值最大的分块因子作为最佳分块因子。

进一步的,向量因子为向量寄存器可容纳的最大操作数数目。

进一步的,可向量化数据的数目计算具体步骤为:

1)、初始化使可向量化数据的数目归零;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010706144.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top