[发明专利]一种芯片监控方法、系统、存储介质及设备有效

专利信息
申请号: 202111605672.1 申请日: 2021-12-25
公开(公告)号: CN114490241B 公开(公告)日: 2023-09-15
发明(设计)人: 宋小妹 申请(专利权)人: 苏州浪潮智能科技有限公司
主分类号: G06F11/30 分类号: G06F11/30;G06F16/9032
代理公司: 北京连和连知识产权代理有限公司 11278 代理人: 张涛;杨帆
地址: 215000 江苏省苏州*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 芯片 监控 方法 系统 存储 介质 设备
【说明书】:

发明提供了一种芯片监控方法、系统、存储介质及设备,方法包括:响应于解析模块检测到芯片接入至集群,对芯片对应的规范化配置文件进行解析,以生成最新监控查询语句;由解析模块将最新监控查询语句推送至推理平台的检测接口,并由检测接口检测推理平台的数据库中是否存在芯片的监控查询语句;响应于不存在芯片的监控查询语句,由解析模块将最新监控查询语句添加至数据库;由监控系统从数据库中加载最新监控查询语句;响应于加载成功,对芯片进行监控。本发明提高了对异构芯片监控的灵活性,避免了开发人员需要根据不同的芯片开发不同的监控服务,节省了人力成本和时间成本,并且能在用户使用芯片后迅速提供监控服务,提升了用户体验。

技术领域

本发明涉及服务器技术领域,尤其涉及一种芯片监控方法、系统、存储介质及设备。

背景技术

如今,AI(Artificial Intelligence,人工智能)芯片种类繁多,且由多种不同的厂商提供,因而多为异构芯片。同时,各厂商会提供相应的插件来使芯片托管在k8s(Kubernetes)集群内部,从而调度各芯片计算资源。寒武纪以及英伟达这些芯片厂商在提供相应的芯片之后,为接入k8s集群监控,芯片厂商各自定制了相关的组件对接到prometheus(一种监控系统),AI推理平台的开发人员需研究如何部署组件,如何获取监控指标,然后定制化将其加入到AI推理平台,进行异构芯片的监控。

不管是异构芯片厂商还是AI推理平台,在开发相应的监控工具的时候都有很大的开发量:对于异构芯片厂商,需要开发针对异构芯片的组件用于采集监控数据;对于AI推理平台,需要研究组件的部署,监控数据的对接,后台的数据处理,前端页面的适配。因而从异构芯片的使用到监控需要大量的时间。AI推理平台已对异构芯片的接入服务进行抽象化,使得用户可在推理集群中发现、使用计算资源,对于AI推理平台已经支持的异构资源,例如:英伟达GPU(T4、V100、P100、P4、RTX系列)、寒武纪MLU S270、高通AIC100、百度昆仑K200、鲲云CorerainX9、Xilinx FPGA U50、浪潮FPGA F37X等,在安装好相应的插件之后,用户可以直接使用上述加速卡进行推理服务。虽然目前用户可以使用这些异构资源,但对异构资源的监控还需要大量的开发工作。鉴于传统技术方法需要开发人员花费大量的时间来做出大量的工作,导致出现推理平台服务在已经可以使用此类异构卡时,却不能进行及时监控的现象,从而给用户造成困扰。

发明内容

有鉴于此,本发明的目的在于提出一种芯片监控方法、系统、存储介质及设备,用以解决现有技术中对不同的AI芯片缺乏规范化的监控方法的问题。

基于上述目的,本发明提供了一种芯片监控方法,包括以下步骤:

响应于解析模块检测到芯片接入至集群,对芯片对应的规范化配置文件进行解析,以生成最新监控查询语句;

由解析模块将最新监控查询语句推送至推理平台的检测接口,并由检测接口检测推理平台的数据库中是否存在芯片的监控查询语句;

响应于不存在芯片的监控查询语句,由解析模块将最新监控查询语句添加至数据库;

由监控系统从数据库中加载最新监控查询语句;

响应于加载成功,对芯片进行监控。

在一些实施例中,响应于不存在芯片的监控查询语句,由解析模块将最新监控查询语句添加至数据库包括:

响应于不存在芯片的监控查询语句,向检测接口返回第一标志位;

响应于解析模块检测到检测接口具有第一标志位,基于第一标志位将最新监控查询语句添加至数据库。

在一些实施例中,方法还包括:

响应于存在芯片的监控查询语句,判断其内容与最新监控查询语句的内容是否相同;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111605672.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top