[发明专利]针对GPU计算核进行性能统计分析的方法、装置及介质在审

专利信息
申请号: 202210300924.8 申请日: 2022-03-25
公开(公告)号: CN114385474A 公开(公告)日: 2022-04-22
发明(设计)人: 齐航空;张竞丹;李亮 申请(专利权)人: 西安芯瞳半导体技术有限公司
主分类号: G06F11/34 分类号: G06F11/34;G06F11/30
代理公司: 西安维英格知识产权代理事务所(普通合伙) 61253 代理人: 侯丽丽;沈寒酉
地址: 710065 陕西省西安市高*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 针对 gpu 计算 进行 性能 统计分析 方法 装置 介质
【权利要求书】:

1.一种针对GPU计算核进行性能统计分析的方法,其特征在于,所述方法包括:

根据执行计算任务的调度顺序对被调度的调度单元进行排序;

针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间;

将所有被调度的目标处理核的执行总时间中的最大值确定为所述待分析的GPU执行所述计算任务所需的总体时间。

2.根据权利要求1所述的方法,其特征在于,所述根据执行计算任务的调度顺序对被调度的调度单元进行排序,包括:

根据执行计算任务的调度顺序为每个被调度的调度单元进行标识;

将每个被调度的调度单元对应的标识以及执行时间按照所述调度顺序填写入一队列。

3.根据权利要求2所述的方法,其特征在于,所述针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间,包括:

将所述待分析的GPU中用于执行所述计算任务的每个处理核的执行总时间初始化为零;

从所述队列中读取第i个被调度的调度单元对应的标识以及执行时间,其中,1≤i≤N-1,N为所有被调度的调度单元数量;

从所有处理核中选择执行总时间最少的处理核;

根据所述第i个被调度的调度单元对应的执行时间更新被选择的处理核的执行总时间;

读取第i+1个被调度的调度单元对应的标识以及执行时间,以及从所有处理核中选择执行总时间最少的处理核,并根据所述第i+1个被调度的调度单元对应的执行时间更新被选择的处理核的执行总时间,直至所有被调度的调度单元从所述队列中读取完毕。

4.根据权利要求3所述的方法,其特征在于,所述将所述待分析的GPU中用于执行所述计算任务的每个处理核的执行总时间初始化为零,包括:

构建一长度为M的全零数组;其中,M表示所述待分析的GPU中用于执行所述计算任务的处理核数量;数组中的各元素对应的编号与处理核的标识对应且数组中的各元素表示对应处理核的执行总时间。

5.根据权利要求2或3所述的方法,其特征在于,所述队列满足先入先出FIFO规则。

6.根据权利要求1所述的方法,其特征在于,所述被调度的调度单元包括被调度的线程或者被调度的线程簇WARP。

7.一种针对GPU计算核进行性能统计分析的装置,其特征在于,所述装置包括:排序部分、统计部分和确定部分;其中,

所述排序部分,经配置为根据执行计算任务的调度顺序对被调度的调度单元进行排序;

所述统计部分,经配置为针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间;

所述确定部分,经配置为将所有被调度的目标处理核的执行总时间中的最大值确定为所述待分析的GPU执行所述计算任务所需的总体时间。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安芯瞳半导体技术有限公司,未经西安芯瞳半导体技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210300924.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top