[发明专利]资源分配方法、系统、装置、设备及存储介质在审
申请号: | 202210972554.2 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115202887A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 岳明 | 申请(专利权)人: | 中电信数智科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京知汇林知识产权代理事务所(普通合伙) 11794 | 代理人: | 王俊杰 |
地址: | 100036 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 分配 方法 系统 装置 设备 存储 介质 | ||
本发明实施例提供了一种资源分配方法、系统、装置、设备及存储介质。根据本发明实施例的资源分配方法,获取目标算法的标识,根据所述目标算法的标识以及预先存储的多个算法标识与资源占用参数的对应关系确定所述目标算法的标识对应的目标算法的资源占用参数,根据所述目标算法的资源占用参数为所述目标算法分配资源,本公开能够提高对GPU算力资源的利用率。
技术领域
本发明属于检测领域,尤其涉及一种资源分配方法、系统、装置、设备及存储介质。
背景技术
图形处理器(graphics processing unit,GPU)的特点是并行处理能力强、计算能效比高,并且有很大的存储带宽。某些应用,例如人工智能模型训练与推理、高性能计算等,往往是大数据流应用,这时,用GPGPU解决这类问题,就比CPU效率更高,它对于用传统语言编写的、软件形式的计算有较好的支持,具有高度的灵活性。GPU算力资源已经成为AI计算不可或缺的基础设施。在当前的GPU的应用过程中,GPU的算力资源往往存在较大冗余,如何对冗余的GPU算力进行利用,是当前亟待解决的问题。
发明内容
本发明实施例提供一种资源分配方法、系统、装置、设备及存储介质,能够提高对GPU算力资源的利用率。
第一方面,本发明实施例提供一种资源分配方法,方法包括:
获取目标算法的标识;
根据目标算法的标识以及预先存储的多个算法标识与资源占用参数的对应关系确定目标算法的标识对应的目标算法的资源占用参数;
根据目标算法的资源占用参数为目标算法分配资源。
在本公开的一个实施例中,目标算法的资源占用参数包括输入资源参数以及主机资源占用参数;
主机资源占用参数包括显存资源占用参数、算力资源占用参数、编解码资源占用参数、线程占用参数、内存资源占用参数以及硬盘存储资源占用参数。
在本公开的一个实施例中,在根据目标算法的标识以及预先存储的多个算法标识与资源占用参数的对应关系确定目标算法的标识对应的目标算法的资源占用参数之前,方法还包括:
向算法输入不同比例的输入资源参数,得到每个比例的输入资源参数对应的测试结果以及主机资源占用参数;
在多个测试结果中,获取最优的测试结果对应的比例的输入资源参数以及主机资源占用参数;
在最优的测试结果对应的主机资源占用参数不超过预设阈值的情况下,将最优的测试结果对应的比例的输入资源参数以及主机资源占用参数与算法的标识建立对应关系;
将最优的测试结果对应的比例的输入资源参数以及主机资源占用参数与算法的标识的对应关系存储。
在本公开的一个实施例中,方法还包括:
在最优的测试结果对应的主机资源占用参数超过预设阈值的情况下,确定次优的测试结果对应的主机资源占用参数是否超过预设阈值;
在次优的测试结果对应的主机资源占用参数不超过预设阈值的情况下,将次优的测试结果对应的比例的输入资源参数以及主机资源占用参数与算法的标识建立对应关系。
在本公开的一个实施例中,预设阈值是根据本地服务器对应的显存资源最大参数、算力资源最大参数、编解码资源最大参数、线程最大参数、内存资源最大参数以及硬盘存储资源最大参数确定的。
第二方面,本公开实施例提供了一种资源分配系统,系统包括分析模块;
分析模块用于获取目标算法的标识,根据目标算法的标识以及预先存储的多个算法标识与资源占用参数的对应关系确定目标算法的标识对应的目标算法的资源占用参数,根据目标占用参数为目标算法分配资源;资源占用参数包括输入资源参数以及主机资源占用参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电信数智科技有限公司,未经中电信数智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210972554.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种融合知识信息的领域专利质量等级预测方法
- 下一篇:一种多纤维混棉工艺