[发明专利]一种共享资源的方法及装置在审
| 申请号: | 201811126206.3 | 申请日: | 2018-09-26 |
| 公开(公告)号: | CN109376009A | 公开(公告)日: | 2019-02-22 |
| 发明(设计)人: | 刘青 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48;G06F9/455 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 胡艳华;解婷婷 |
| 地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 共享资源 服务器 集群管理系统 资源调度方式 图形处理单元 共享模式 任务调度 | ||
本文公开了一种共享资源的方法及装置。所述共享资源的方法包括:通过Kubernetes容器集群管理系统获取服务器的图形处理单元GPU资源调度方式信息;在服务器的GPU资源调度方式设置为共享模式时,通过Kubernetes容器集群管理系统将多个容器任务调度到所述服务器的同一个GPU上。本文的技术方案能够提高GPU资源的利用率。
技术领域
本发明涉及计算机技术领域,尤其涉及的是一种共享资源的方法及装置。
背景技术
伴随着人工智能技术的发展,深度学习逐渐兴起。深度学习的实现,需要多种技术进行支撑,比如服务器、GPU(Graphics Processing Unit,图形处理单元)、集群、集群管理调度软件、深度学习框架、深度学习的具体应用等。
Kubernetes具有完备的集群管理能力、多层次安全防护和准入机制、多租户应用支撑能力、强大的故障发现和自我修复能力以及多粒度的资源配额管理能力。kubernetes从1.6版本之后增加了对GPU资源的调度,因此被广泛地应用在人工智能领域作为深度学习的调度和监控支撑平台。
但是,目前的Kubernetes系统对于GPU的调度,只支持独享模式,多容器不能共享同一个GPU资源。由于深度学习的训练作业一般无法占满所分配的GPU资源,会导致GPU资源的浪费。而GPU作为一种昂贵的计算资源,这种浪费大大增加了平台的运营成本。
发明内容
本发明实施例所要解决的技术问题是提供一种共享资源的方法及装置,提高GPU资源的利用率。
本发明实施例提供一种共享资源的方法,包括:
通过Kubernetes容器集群管理系统获取服务器的图形处理单元GPU资源调度方式信息;
在服务器的GPU资源调度方式设置为共享模式时,通过Kubernetes容器集群管理系统将多个容器任务调度到所述服务器的同一个GPU上。
本发明实施例提供一种共享资源的装置,包括:
信息获取模块,用于通过Kubernetes容器集群管理系统获取服务器的图形处理单元GPU资源调度方式信息;
调度模块,用于在服务器的GPU资源调度方式设置为共享模式时,通过Kubernetes容器集群管理系统将多个容器任务调度到所述服务器的同一个GPU上。
本发明实施例提供一种共享资源的装置,包括:
存储器、处理器及存储在所述存储器上并可在所述处理器上运行的共享资源的程序,所述共享资源的程序被所述处理器执行时实现上述共享资源的方法的步骤。
与相关技术相比,本发明实施例提供一种共享资源的方法及装置,通过Kubernetes容器集群管理系统获取服务器的图形处理单元GPU资源调度方式信息,在服务器的GPU资源调度方式设置为共享模式时,通过Kubernetes容器集群管理系统将多个容器任务调度到所述服务器的同一个GPU上。本发明实施例的技术方案能够提高GPU资源的利用率。
附图说明
图1为本发明实施例1的一种共享资源的方法流程图;
图2为本发明实施例2的一种共享资源的装置示意图;
图3为本发明示例1的一种GPU资源共享的示意图;
图4为本发明示例1的一种共享GPU资源的方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
实施例1
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811126206.3/2.html,转载请声明来源钻瓜专利网。





