[发明专利]一种GPU资源分配方法、系统、设备以及介质在审
| 申请号: | 202210111346.3 | 申请日: | 2022-01-29 |
| 公开(公告)号: | CN114564302A | 公开(公告)日: | 2022-05-31 |
| 发明(设计)人: | 王超;刘慧兴 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50 |
| 代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张涛;黄艳南 |
| 地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种GPU资源分配方法,包括以下步骤:响应于接收到训练任务,获取所述训练任务中携带的显存类型和大小,其中显存类型包括持久显存和临时显存;根据所述显存类型和大小为所述训练任务分配对应大小的持久显存和/或临时显存;响应于检测到所述训练任务当前迭代结束,清理所述临时显存,当所述训练任务开始下一次迭代训练时,重新分配临时显存并继续使用初始分配的持久显存;响应于所述训练任务最后一次迭代训练结束,同时清理所述临时显存和所述持久显存。本发明还公开了一种系统、计算机设备以及可读存储介质。本发明提出的方案保障了GPU整体的利用率维持在较高水平,从而实现提升训练性能和提高数据中心资源利用率的目的。 | ||
| 搜索关键词: | 一种 gpu 资源 分配 方法 系统 设备 以及 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210111346.3/,转载请声明来源钻瓜专利网。





