[发明专利]基于kernel函数的时间开销模型构建方法及系统有效

申请号：	201610816194.1	申请日：	2016-09-09
公开（公告）号：	CN106502771B	公开（公告）日：	2019-08-02
发明（设计）人：	王剑秦;王佳弘;林枝宏;孙瑞志	申请（专利权）人：	中国农业大学
主分类号：	G06F9/48	分类号：	G06F9/48;G06F9/50
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	李相雨
地址：	100193 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于kernel函数的时间开销模型构建方法及系统，首先将并行程序kernel函数的开销时间分为线程块的分配时间和kernel函数的执行时间两个部分，然后分别对这两部分时间进行分析，构建相应的时间方程；其中执行时间部分充分考虑到了计算与访存的重叠以及可能出现的各种情况，并提出两个并行度参数来对kernel函数的执行时间进行表示；最后将这两部分时间进行叠加，得到最终的kernel函数时间开销模型。用户通过该模型能够得到应用程序在GPU上的运行时间，便于广大用户及时分析待移植的程序，合理安排工作，同时也有利于GPU的有效利用，避免经济与时间上的损失。
搜索关键词：	基于 kernel 函数时间开销模型构建方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于kernel函数的时间开销模型构建方法，其特征在于，包括：S1、根据GPU的硬件结构和待移植的并行程序构造warp访存并行度WMPD，并计算所述并行程序在GPU上并行运行之前，kernel函数中的线程块block分配到GPU架构中流多处理器SM上的时间，记为分配时间；S2、根据所述warp访存并行度WMPD计算所述并行程序在GPU上的实际执行时间，记为执行时间；S3、根据所述分配时间和执行时间构建基于GPU编程模型中kernel函数的时间开销模型；其中，所述WMPD的计算公式为其中，N_{Max_Active_Blocks_per_SM}为每个SM上最大活动线程块数量，dGrid为线程块的总数量，N_SMs为GPU架构中流多处理器的数量，dBlock为每个线程块中线程的数量，warpSize为每个warp中的线程数目；所述分配时间T_init的计算公式为T_init＝dGrid×T_allo，其中，T_allo为每个线程块被分配到SM上的时间；所述执行时间T_GPU的计算公式为其中，T_C为每个线程的计算时间，T_C＝Comp_Cycle×Comp_insts，Comp_Cycle为执行每条计算语句的时间，Comp_insts为每个线程中计算指令数，N_Threads为线程的总数量，N为每个流多处理器上分配到的线程块个数，T_M为每个线程的访存时间，T_M＝Mem_Cycle×Mem_insts，Mem_Cycle为执行每条访存语句的时间，Mem_insts为每个线程中访存指令数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国农业大学，未经中国农业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610816194.1/，转载请声明来源钻瓜专利网。

上一篇：一种动态返回数据的方法、服务端及系统
下一篇：一种基于物联网的气象信息采集系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于kernel函数的时间开销模型构建方法及系统有效

专利文献下载