[发明专利]基于模糊决策的GPU负载综合评判方法在审
申请号: | 201410341239.5 | 申请日: | 2014-07-18 |
公开(公告)号: | CN104123452A | 公开(公告)日: | 2014-10-29 |
发明(设计)人: | 杨刚;张策;周兴社;杜三盛 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710072 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 决策 gpu 负载 综合 评判 方法 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于模糊决策的GPU(Graphic Processing Unit,图形处理器)的负载评价方法。
背景技术
Kepler GK110(专为英伟达Tesla产品打造CUDA计算架构)由71亿个晶体管组成,可以提供超过每秒1万亿次双精度浮点计算的吞吐量,Kepler架构在电源效率方面,比Fermi的性能/功率比提高了3倍。完整Kepler GK110实施包括15 SMX单元和六个64位内存控制器。拥有192个单精度CUDA(Compute Unified Device Architecture,统一计算设备架构)核,64个双精度单元。
C-RAN(新型无线接入网架构)白皮书指出传统的无线接入网面临的挑战有大量基站导致高额能耗、潮汐效应导致基站利用率低下。把GPU作为资源池,进行基带处理,刚好解决了这个问题。基带处理就要求GPU可以任务级别的并行处理每个用户的需求。
GPU虽然提供了非常强大的数据级并行计算能力,不过对于任务级别的并行有比较大的限制。最新的kepler架构支持同时并发32个核函数。因此为了满足多任务的需求就需要在一个主机上装备多块GPU。对于多GPU系统需要解决GPU之间的负载均衡,才能达到最佳性能,因此正确评价某一个GPU的负载信息至关重要。
发明内容
本发明的实施例提供一种基于模糊决策的GPU的负载评价方法,可以正确地对GPU的负载进行评价。
为达到上述目的,本发明的实施例采用如下技术方案:
一种基于模糊决策的GPU的负载评价方法,包括:
针对一个GPU来说,获得n时刻所述GPU的负载向量。
所述GPU的负载向量表示如下:
Ln=<utilization,memory,pstates,occupancy>
其中,utilization:过去一个样本时间内所述GPU运行一个或者多个核函数的时间占总时间的百分比;memory:所述GPU已用全局内存占总的全局内存的百分比;pstates:即performance state的16个等级,p0(maximum performance)-p15(minimum performance);occupancy:即achieved occupancy:所述GPU的每个sm中有多个warp调度器,每个调度器有一个硬件性能计数器,用来计数每个时钟周期活跃warp数,每个调度器计数结果之和除以sm活跃的总周期数,就可以得到这个sm的活跃warp数,除以sm理论最大warp数就是kernel执行期间这个sm的occupancy,所有sm的平均值就是整体的occupancy;
获得n时刻评价负载用的评价负载向量L,所述L满足以下公式:
L=70%×Ln+30%×Ln-1;
综合所述评价负载向量L中的元素utilization,memory,pstates,以及occupancy进行模糊评判,获得模糊判决矩阵:R=(rij)4×3;
根据用户给出的诸因素权重分配为:W=(w1,w2,w3,w4)以及模糊判决矩阵计算获得综合评价A,所述A满足以下公式:
A=W·R=(a1,a2,a3);
对所述综合评价A进行归一化处理获得A′,所述A′满足以下公式:
A′=(a1/s,a2/s,a3/s);其中,
根据最大隶属度原则获得所述GPU的负载情况。
上述技术方案提供的GPU的负载评价方法,综合GPU的多个参数utilization,memory,patates,occupancy,与现有技术众对GPU负载的评价都是基于单一参数相比,更加客观的反映了GPU负载信息,对GPU的负载评价更正确。
附图说明
图1为本发明实施例提供的一种基于模糊决策的GPU的负载评价方法的流程示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410341239.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用