[发明专利]一种资源分配方法、装置、计算机设备及存储介质有效
申请号: | 202110497525.0 | 申请日: | 2021-05-08 |
公开(公告)号: | CN113110938B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 王军伟;李想成;吴爽;王端;赵增;刘柏;李仁杰;范长杰;程龙;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 徐世俊 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 资源 分配 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例公开了一种资源分配方法、装置、计算机设备及存储介质。该方法包括:确定满足当前待调度应用所需资源请求量的目标服务器节点;确定通过设备插件分配的已分配处理资源;根据已分配处理资源确定目标服务器节点的资源分配信息;基于资源分配信息从目标服务器节点的处理资源中确定目标处理资源,并为待调度应用分配目标处理资源。可以保证服务器中的处理资源的隔离以及应用程序的正常运行。
技术领域
本申请涉及计算机技术领域,具体涉及一种资源分配方法、装置、计算机设备及存储介质。
背景技术
随着云计算的发展,容器技术得到了普遍应用。基于应用容器引擎(例如Docker)和容器调度平台(例如Kubernetes)的容器云也逐渐成为云平台建设的基座,容器技术能够加速软件的部署。伴随着人工智能技术的大规模落地,将深度学习应用部署在Kubernetes平台上提供服务也逐渐成为一种趋势,深度学习应用往往需要图形处理器(GraphicsProcessing Unit,GPU)资源。
相关技术中,在现有基于Kubernetes的架构下,Kubernetes会根据Deployment(用于管理无状态应用)下的调度单元(例如Pod)申请的GPU数量情况去筛选出GPU节点,当绑定到节点后,相应节点上的设备插件会根据GPU使用情况分配GPU设备,然后由Kubelet(负责维护容器的生命周期)根据设备插件返回的分配信息来创建容器并挂载GPU设备。
在对相关技术的研究和实践中,本申请的发明人发现,现有技术中,由于现有的调度器和设备插件的GPU视图只有一个,当集群中存在多个插件来调度GPU设备时,就可能存在不同GPU应用的Pod分别被不同设备插件分配了同一GPU设备,这样就会使得同一GPU设备上存在多个应用,造成多个应用之间算力和存储资源的竞争,从而影响应用程序的正常运行。
发明内容
本申请实施例提供一种资源分配方法、装置、计算机设备及存储介质,可以保证服务器中的处理资源的隔离以及应用程序的正常运行。
本申请实施例提供了一种资源分配方法,包括:
确定满足当前待调度应用所需资源请求量的目标服务器节点;
确定通过所述设备插件分配的已分配处理资源;
根据所述已分配处理资源确定所述目标服务器节点的资源分配信息;
基于所述资源分配信息从所述目标服务器节点的处理资源中确定目标处理资源,并为所述待调度应用分配所述目标处理资源。
相应的,本申请实施例还提供了一种资源分配装置,包括:
第一确定单元,用于确定满足当前待调度应用所需资源请求量的目标服务器节点;
第二确定单元,用于确定通过所述设备插件分配的已分配处理资源;
第三确定单元,用于根据所述已分配处理资源确定所述目标服务器节点的资源分配信息;
分配单元,用于基于所述资源分配信息从所述目标服务器节点的处理资源中确定目标处理资源,并为所述待调度应用分配所述目标处理资源。
在一些实施例中,第三确定单元包括:
第一获取子单元,用于获取所述目标服务器节点中的处理资源;
第一确定子单元,用于根据所述已分配处理资源,以及所述目标服务器节点中的处理资源,确定所述目标服务器节点中已被分配的处理资源,得到所述资源分配信息。
在一些实施例中,分配单元包括:
第二确定子单元,用于基于所述资源分配信息从所述目标服务器节点的处理资源中确定未分配处理资源;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110497525.0/2.html,转载请声明来源钻瓜专利网。