[发明专利]一种人工智能云平台的资源碎片整理方法及电子设备有效
申请号: | 201711420769.9 | 申请日: | 2017-12-25 |
公开(公告)号: | CN108153594B | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 陈旭;王奇刚 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人工智能 平台 资源 碎片 整理 方法 电子设备 | ||
本申请公开了一种人工智能云平台的资源碎片整理方法及电子设备,所述云平台中部署有多个资源节点,每个资源节点上部署有计算资源,所述方法包括:获得云平台中资源节点的资源运行状态;基于资源运行状态,生成碎片整理指令;响应于碎片整理指令,基于资源运行状态,利用预先训练的碎片识别模型,识别出云平台中存在资源碎片的资源节点;确定碎片迁移的源节点和目标节点以及源节点中待迁移的目标碎片;将源节点中的目标碎片迁移到目标节点中。本申请中利用预先训练的碎片识别模型对云平台中的资源碎片进行识别,再进行碎片迁移,从而实现碎片整理,使得整理后的碎片能够在云平台中继续为用户提供服务,从而提高云平台资源的使用率。
技术领域
本申请涉及数据处理技术领域,特别涉及一种人工智能云平台的资源碎片整理方法及电子设备。
背景技术
随着网络的发展,支撑大数据计算的人工智能云平台的使用越来越广泛,例如,人工智能云平台可以为多个作业同时提供运行资源,如图形处理器GPU(GraphicsProcessing Unit)计算资源等。
而在实际应用中,随着多作业对云平台中资源的申请与释放,会造成资源碎片的产生,从而导致资源分配的性能下降或者无法分配,造成作业无法正常运行,使得云平台的资源使用率下降。
发明内容
本申请的目的是提供一种人工智能云平台的资源碎片整理方法及电子设备,用以解决现有技术中资源碎片产生使得云平台资源使用率下降的技术问题。
本申请提供了一种人工智能云平台的资源碎片整理方法,所述云平台中部署有多个资源节点,每个资源节点上部署有计算资源,所述方法包括:
获得所述云平台中资源节点的资源运行状态;
基于所述资源运行状态,生成碎片整理指令;
响应于所述碎片整理指令,基于所述资源运行状态,利用预先训练的碎片识别模型,识别出所述云平台中存在资源碎片的资源节点;
确定碎片迁移的源节点和目标节点以及所述源节点中待迁移的目标碎片;
将所述源节点中的目标碎片迁移到所述目标节点中。
上述方法,优选地,所述碎片识别模型可以通过以下方式获取:
获取历史碎片信息,所述历史碎片信息包括:所述云平台中标记的碎片记录信息;
对所述标记的碎片记录信息进行深度学习,得到所述云平台的碎片识别模型。
上述方法,优选地,基于所述资源运行状态,生成碎片整理指令,包括:
利用预先通过所述平台中的历史资源信息经过深度学习获得的整理预测模型,对所述资源运行状态进行判断是否进行碎片整理,得到判断结果;
基于所述判断结果,生成碎片整理指令。
上述方法,优选地,所述方法还包括:
获得碎片整理记录信息;
利用所述碎片整理记录信息对所述整理预测模型进行优化。
上述方法,优选地,在将所述源节点中的目标碎片迁移到所述目标节点中之前,所述方法还包括:
对所述目标碎片进行快照;
在将所述目标碎片迁移到所述目标节点之后,所述方法还包括:
恢复所述目标碎片上的作业运行。
上述方法,优选地,确定碎片迁移的源节点和目标节点以及所述源节点中待迁移的目标碎片,包括:
获得所述存在资源碎片的资源节点中的碎片状态信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711420769.9/2.html,转载请声明来源钻瓜专利网。