[发明专利]针对GPU计算核进行性能统计分析的方法、装置及介质在审
| 申请号: | 202210300924.8 | 申请日: | 2022-03-25 |
| 公开(公告)号: | CN114385474A | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 齐航空;张竞丹;李亮 | 申请(专利权)人: | 西安芯瞳半导体技术有限公司 |
| 主分类号: | G06F11/34 | 分类号: | G06F11/34;G06F11/30 |
| 代理公司: | 西安维英格知识产权代理事务所(普通合伙) 61253 | 代理人: | 侯丽丽;沈寒酉 |
| 地址: | 710065 陕西省西安市高*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 针对 gpu 计算 进行 性能 统计分析 方法 装置 介质 | ||
1.一种针对GPU计算核进行性能统计分析的方法,其特征在于,所述方法包括:
根据执行计算任务的调度顺序对被调度的调度单元进行排序;
针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间;
将所有被调度的目标处理核的执行总时间中的最大值确定为所述待分析的GPU执行所述计算任务所需的总体时间。
2.根据权利要求1所述的方法,其特征在于,所述根据执行计算任务的调度顺序对被调度的调度单元进行排序,包括:
根据执行计算任务的调度顺序为每个被调度的调度单元进行标识;
将每个被调度的调度单元对应的标识以及执行时间按照所述调度顺序填写入一队列。
3.根据权利要求2所述的方法,其特征在于,所述针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间,包括:
将所述待分析的GPU中用于执行所述计算任务的每个处理核的执行总时间初始化为零;
从所述队列中读取第
从所有处理核中选择执行总时间最少的处理核;
根据所述第
读取第
4.根据权利要求3所述的方法,其特征在于,所述将所述待分析的GPU中用于执行所述计算任务的每个处理核的执行总时间初始化为零,包括:
构建一长度为M的全零数组;其中,M表示所述待分析的GPU中用于执行所述计算任务的处理核数量;数组中的各元素对应的编号与处理核的标识对应且数组中的各元素表示对应处理核的执行总时间。
5.根据权利要求2或3所述的方法,其特征在于,所述队列满足先入先出FIFO规则。
6.根据权利要求1所述的方法,其特征在于,所述被调度的调度单元包括被调度的线程或者被调度的线程簇WARP。
7.一种针对GPU计算核进行性能统计分析的装置,其特征在于,所述装置包括:排序部分、统计部分和确定部分;其中,
所述排序部分,经配置为根据执行计算任务的调度顺序对被调度的调度单元进行排序;
所述统计部分,经配置为针对排序后的每个被调度的调度单元,将对应的执行时间统计至待分析的GPU中所述调度单元被调度至目标处理核的执行总时间;
所述确定部分,经配置为将所有被调度的目标处理核的执行总时间中的最大值确定为所述待分析的GPU执行所述计算任务所需的总体时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安芯瞳半导体技术有限公司,未经西安芯瞳半导体技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210300924.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防旋转吊钩装置
- 下一篇:一种金属铱化合物及其制备方法和应用





