[发明专利]面向非规则数据密集应用的群组式线程预取方法有效
申请号: | 201710039875.6 | 申请日: | 2017-01-19 |
公开(公告)号: | CN106776047B | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 黄艳;谷培培;李玉华;张启坤;朱会东;梁树军;范乃梅 | 申请(专利权)人: | 郑州轻工业学院 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张真真;栗改 |
地址: | 450002 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种面向非规则数据密集应用的群组式线程预取方法,采用在线剖析技术获取非规则数据密集应用的执行时特征,确定合理的预取率构建群组式预取线程实现有效数据预取,包括非规则数据访存特征剖析、群组式预取线程构建及线程同步机制的确立。本发明基于片上多核处理器环境中面向非规则数据密集应用执行数据预取,能确保及时准确地发出预取请求,减少无用数据预取和线程之间的共享资源竞争,预取线程构建能量消耗较低,并具有较好的实用性和灵活性。 | ||
搜索关键词: | 面向 规则 数据 密集 应用 群组式 线程 方法 | ||
【主权项】:
1.一种面向非规则数据密集应用的群组式线程预取方法,其特征在于,采用在线剖析技术获取非规则数据密集应用的执行时特征,确定合理的预取率构建群组式预取线程实现有效数据预取,其步骤如下:包括非规则数据访存特征剖析、群组式预取线程构建及线程预取中同步机制的确立;所述非规则数据访存特征剖析包括:A)使用VTUNE性能分析器获取非规则数据密集应用的执行行为特征;B)使用VTUNE性能分析器获取热点循环相对延迟的计算延迟TC、循环依赖数据访问延迟Tdm和非循环依赖数据访问延迟Tim值;所述群组式预取线程构建包括:C) 判断计算延迟TC和循环依赖数据访问延迟与非循环依赖数据访问延迟之和(Tdm+Tim) 的关系;D) 当TC<(Tdm+Tim)时,基于理想情况下确定合理的预取率R= (TC+Tim ‑Tdm)/2;当TC≥(Tdm+Tim)时,预取率R值等于1;E) 利用切片技术基于预取率R构建群组式预取线程;群组式线程预取方法根据辅助线程能够隐藏的访存延迟比例分配预取数据群组;首先使用程序profile工具VTUNE性能分析器在运行时测试代码的长延迟的访存指令,并以profile文件的形式保存下来;其次,编译器根据profile文件信息和选定的循环区域将要预取的关键指令抽取出来即根据预取率只选择部分循环依赖取数指令,并保留对循环结构有影响的代码,删除其它非关键的代码,完成切片形成辅助线程的代码块;最后,将切片后的代码移植到辅助线程中,在主线程中插入辅助线程触发指令,并在辅助线程和主线程中插入同步代码块,保证帮助线程正常而有效的执行;所述线程预取中同步机制的确立包括:F) 在主线程热点循环入口处设置标志位flag为1,向预取线程发出信号,通知预取线程开始预取工作;在主线程热点循环出口处设置标志位flag为0,向预取线程发送暂停信号,通知预取线程暂停预取,等待下一次预取信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院,未经郑州轻工业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710039875.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种SCST读写优化方法及系统
- 下一篇:一种实时虚拟机内存调度方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置