[发明专利]基于GPU的矩阵加速计算的方法在审

申请号：	202210277009.1	申请日：	2022-03-21
公开（公告）号：	CN114675966A	公开（公告）日：	2022-06-28
发明（设计）人：	周晓辉;袁博;李海鹏	申请（专利权）人：	算筹（深圳）信息科技有限公司
主分类号：	G06F9/50	分类号：	G06F9/50;G06F17/16
代理公司：	济南誉琨知识产权代理事务所(普通合伙) 37278	代理人：	郝泳锐
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 gpu 矩阵加速计算方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于GPU的矩阵加速计算的方法，其特征在于，包括以下步骤：

a、首先将计算任务处理成双向队列；

b、然后检测CPU/GPU异构计算系统是否第一次运行该计算任务，若是，则按照CPU单处理器核计算的理论峰值以及GPU的理论峰值的计算能力，从队首和队尾分别分配给CPU和GPU计算任务，确定CPU和GPU的实际计算时间；

c、然后根据CPU或GPU中最短完成任务的时间分配负载量；

d、若CPU和GPU同时完成任务，则计算此类任务的CPU分配任务的负载比例，确定该计算任务的最佳分配方案，若CPU或GPU提前完成任务，则将剩余的任务确定为动态调整任务，由CPU和GPU共同完成任务，直至队列首尾相遇，计算任务全部完成，然后，根据CPU和GPU的实际完成的计算量，确定该任务的最佳分配方案；

其中，所述b步骤中，指定一个CPU的处理器核与GPU进行交互，剩下的N-1个处理器核参与计算任务，所述d步骤中，若CPU和GPU同时完成任务，则根据公式：确定该计算任务的最佳分配方案，其中，σ为计算此类任务的CPU分配任务的负载比例，N为CPU的处理器核的数量，V_GPU为GPU的实际计算能力，V_CPU为CPU单处理器核的实际计算能力；若CPU或GPU提前完成任务，则将剩余的任务确定为动态调整任务，由CPU和GPU共同完成任务，直至队列首尾相遇，计算任务全部完成，然后，根据CPU和GPU的实际完成的计算量，再次确定CPU单处理器核的实际计算能力以及GPU的实际处理能力，然后，再次对该任务进行计算，计算所需要的时间那么CPU可以完成的任务量即为T*V_CPU(N-1)，同样，GPU可以完成的任务量为T*V_GPU，按照这个任务量分配给CPU和GPU相应的任务，若CPU和GPU同时完成任务，则验证出此类计算任务的最佳最佳分配方案，若还是不同步完成，则继续重复工作，直到迭代出CPU和GPU同时完成任务时的最佳分配方案。

2.根据权利要求1所述的基于GPU的矩阵加速计算的方法，其特征在于，所述d步骤中，若CPU和GPU同时完成任务，根据公式：计算GPU的实际计算能力，其中，L_GPU为b步骤中以GPU的理论峰值的计算能力从队首或队尾分别分配给GPU计算任务量，T_GPU为GPU完成L_GPU的时间。

3.根据权利要求2所述的基于GPU的矩阵加速计算的方法，其特征在于，所述d步骤中，若CPU和GPU同时完成任务，根据公式：计算CPU单处理器核的实际计算能力，其中，L_CPU为b步骤中以CPU单处理器核计算的理论峰值从队首或队尾分别分配给CPU计算任务量，T_CPU为CPU单处理器核完成L_CPU的时间。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于算筹（深圳）信息科技有限公司，未经算筹（深圳）信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210277009.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种多段同向弯折的工件的抛光装置
下一篇：一种基于碳量子点的透明压力探测装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于GPU的矩阵加速计算的方法在审

专利文献下载