[发明专利]一种GPU资源调度方法、装置、电子设备及存储介质在审
申请号: | 202211211379.1 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115564635A | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 周兆巍;戴燕晨;许亚杰 | 申请(专利权)人: | 杭州海康威视系统技术有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06F9/48 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;孙翠贤 |
地址: | 310051 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 gpu 资源 调度 方法 装置 电子设备 存储 介质 | ||
1.一种GPU资源调度方法,其特征在于,所述方法包括:
获取待处理任务;
根据所述待处理任务对应的目标处理算法、以及资源池中计算资源的空闲情况,从所述资源池中为所述待处理任务分配目标计算资源;其中,所述计算资源包括实体GPU和虚拟化GPU,所述虚拟化GPU包括物理层虚拟化GPU和应用层虚拟化GPU。
2.根据权利要求1所述的方法,其特征在于,在所述获取待处理任务的步骤之前,所述方法还包括:
对所述资源池中的GPU进行虚拟化处理,得到所述计算资源,其中,所述资源池中包括预设的参与资源调度的多个GPU;所述虚拟化GPU在所述资源池计算资源中的占比满足第一比例;和/或,所述资源池中的目标计算节点的虚拟化GPU在所述目标计算节点的计算资源中的占比满足第二比例。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待处理任务对应的目标处理算法、以及资源池中计算资源的空闲情况,从所述计算资源中为所述待处理任务分配目标计算资源的步骤,包括:
判断所述目标处理算法是否可被虚拟化GPU运行;
若所述目标处理算法可被虚拟化GPU运行,则判断所述资源池中是否存在满足调度要求的空闲虚拟化GPU;
从所述满足调度要求的空闲虚拟化GPU中确定目标虚拟化GPU,其中,所述目标虚拟化GPU包括第一空闲物理层虚拟化GPU或第一空闲应用层虚拟化GPU;
将所述待处理任务下发至所述目标虚拟化GPU。
4.根据权利要求3所述的方法,其特征在于,所述判断所述目标处理算法是否可被虚拟化GPU运行的步骤,包括:
判断所述虚拟化GPU预先配置的虚拟化技术对应的处理算法中,是否包括所述目标处理算法;
如果包括,确定所述目标处理算法可被虚拟化GPU运行。
5.根据权利要求3所述的方法,其特征在于,所述判断所述资源池中是否存在满足调度要求的空闲虚拟化GPU的步骤,包括:
基于所述资源池中的虚拟化GPU的虚拟化比例以及所述虚拟化GPU的被占用算力,判断所述资源池中是否存在空闲虚拟化GPU;
如果存在所述空闲虚拟化GPU,判断所述空闲虚拟化GPU的剩余算力是否满足所述待处理任务的算力需求;
若满足,确定所述空闲虚拟化GPU为所述满足调度要求的空闲虚拟化GPU。
6.根据权利要求3所述的方法,其特征在于,所述从所述满足调度要求的空闲虚拟化GPU中确定目标虚拟化GPU的步骤,包括:
判断所述满足调度要求的空闲虚拟化GPU中是否存在支持目标物理层虚拟化技术的第一虚拟化GPU,其中,所述目标物理层虚拟化技术为所述目标处理算法所适用的物理层虚拟化技术;
如果存在多个所述第一虚拟化GPU,基于每个第一虚拟化GPU对应的物理层虚拟化技术的优先级,从所述第一虚拟化GPU中确定第一空闲物理层虚拟化GPU,其中,所述物理层虚拟化技术的优先级基于所述第一虚拟化GPU对应的模拟虚拟化GPU的处理性能确定,模拟虚拟化GPU为通过多种物理层虚拟化技术对该第一虚拟化GPU对应的GPU进行虚拟化处理得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视系统技术有限公司,未经杭州海康威视系统技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211211379.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种美白祛斑霜及其制备方法
- 下一篇:自润滑关节轴承固化工装及其轴承