[发明专利]面向非规则数据密集应用的群组式线程预取方法有效

专利信息
申请号: 201710039875.6 申请日: 2017-01-19
公开(公告)号: CN106776047B 公开(公告)日: 2019-08-02
发明(设计)人: 黄艳;谷培培;李玉华;张启坤;朱会东;梁树军;范乃梅 申请(专利权)人: 郑州轻工业学院
主分类号: G06F9/50 分类号: G06F9/50;G06F9/48
代理公司: 郑州优盾知识产权代理有限公司 41125 代理人: 张真真;栗改
地址: 450002 *** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种面向非规则数据密集应用的群组式线程预取方法,采用在线剖析技术获取非规则数据密集应用的执行时特征,确定合理的预取率构建群组式预取线程实现有效数据预取,包括非规则数据访存特征剖析、群组式预取线程构建及线程同步机制的确立。本发明基于片上多核处理器环境中面向非规则数据密集应用执行数据预取,能确保及时准确地发出预取请求,减少无用数据预取和线程之间的共享资源竞争,预取线程构建能量消耗较低,并具有较好的实用性和灵活性。
搜索关键词: 面向 规则 数据 密集 应用 群组式 线程 方法
【主权项】:
1.一种面向非规则数据密集应用的群组式线程预取方法,其特征在于,采用在线剖析技术获取非规则数据密集应用的执行时特征,确定合理的预取率构建群组式预取线程实现有效数据预取,其步骤如下:包括非规则数据访存特征剖析、群组式预取线程构建及线程预取中同步机制的确立;所述非规则数据访存特征剖析包括:A)使用VTUNE性能分析器获取非规则数据密集应用的执行行为特征;B)使用VTUNE性能分析器获取热点循环相对延迟的计算延迟TC、循环依赖数据访问延迟Tdm和非循环依赖数据访问延迟Tim值;所述群组式预取线程构建包括:C) 判断计算延迟TC和循环依赖数据访问延迟与非循环依赖数据访问延迟之和(TdmTim) 的关系;D) 当TC<(TdmTim)时,基于理想情况下确定合理的预取率R= (TCTim ‑Tdm)/2;当TC≥(TdmTim)时,预取率R值等于1;E) 利用切片技术基于预取率R构建群组式预取线程;群组式线程预取方法根据辅助线程能够隐藏的访存延迟比例分配预取数据群组;首先使用程序profile工具VTUNE性能分析器在运行时测试代码的长延迟的访存指令,并以profile文件的形式保存下来;其次,编译器根据profile文件信息和选定的循环区域将要预取的关键指令抽取出来即根据预取率只选择部分循环依赖取数指令,并保留对循环结构有影响的代码,删除其它非关键的代码,完成切片形成辅助线程的代码块;最后,将切片后的代码移植到辅助线程中,在主线程中插入辅助线程触发指令,并在辅助线程和主线程中插入同步代码块,保证帮助线程正常而有效的执行;所述线程预取中同步机制的确立包括:F) 在主线程热点循环入口处设置标志位flag为1,向预取线程发出信号,通知预取线程开始预取工作;在主线程热点循环出口处设置标志位flag为0,向预取线程发送暂停信号,通知预取线程暂停预取,等待下一次预取信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院,未经郑州轻工业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710039875.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top