[发明专利]服务器BMC获取GPU温度的方法及装置在审
申请号: | 201810001686.4 | 申请日: | 2018-01-02 |
公开(公告)号: | CN108196999A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 钱晓峰;蔡积淼 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 黄晓燕 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 服务器 温度属性 温度传感器 保证系统 技术支持 温度传递 管理库 获知 操作系统 调用 写入 厂商 传递 监控 安全 | ||
本发明实施例公开了服务器BMC获取GPU温度的方法及装置,方法包括调用NVML管理库中的NVIDIA GPU温度传感器函数,获取NVIDIA GPU的温度值;定义NVIDIA GPU的温度属性,将NVIDIA GPU的温度值传递到操作系统的NVIDIA GPU温度属性里;根据服务器BMC IP,利用GPU温度传递函数,将GPU的温度值写入BMC中。本发明解决了NVIDIA厂商不提供技术支持,无法获知GPU温度的问题,使服务器能够获取到GPU的温度,便于对GPU温度的监控,保证系统的安全。
技术领域
本发明涉及计算机技术领域,具体地说是服务器BMC获取GPU温度的方法及装置。
背景技术
在云计算时代,随着AI(Artificial Intelligence,人工智能)的发展及演进,需要强大的服务器来进行深度学习、视频编解码、科学计算等多种场景的快速、稳定、弹性的计算服务,采用GPU(Graphics Processing Unit,图形处理器)的服务器应运产生。
现将NVIDIA(图形技术和数字媒体处理器厂商)面向消费级市场的图形显示显卡应用在服务器上,相对于NVIDIA面向于数据中心的计算型GPU,能极大的节省成本,并能满足目前AI场景的应用需求。
然而这种GPU由于NVIDIA产品策略问题,并不面向于服务器市场,厂商不提供相应的技术支持及GPU驱动版本,BMC(Baseboard Management Controller基板管理控制器)并不能读取到GPU的温度,导致无法监控GPU温度的问题。
发明内容
本发明实施例中提供了服务器BMC获取GPU温度的方法,以解决现有技术中BMC无法或值GPU温度的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
本发明第一方面提供了服务器BMC获取GPU温度的方法,该方法包括以下步骤:
调用NVML管理库中的NVIDIA GPU温度传感器函数,获取NVIDIA GPU的温度值;
定义NVIDIA GPU的温度属性,将NVIDIA GPU的温度值传递到操作系统的NVIDIAGPU温度属性里;
根据服务器BMC IP,利用GPU温度传递函数,将GPU的温度值写入BMC中。
结合第一方面,在第一方面第一种可能的实现方式中,所述方法还包括:
BMC将GPU温度发送给服务器管理工具,对GPU温度进行监控与预警。
结合第一方面,在第一方面第二种可能的实现方式中,在调用NVML管理库之前还包括:
检查服务器上Python的版本信息,使Python版本符合要求;
检查操作系统中的带有“NVIDIA”模块的属性值,使其属性值符合要求。
结合第一方面,在第一方面第二种可能的实现方式中,所述检查服务器上Python的版本信息,使Python版本符合要求的具体过程为:
定义环境监测函数,设定Python的环境属性;
访问操作系统中的环境变量,查找环境变量为Python的版本信息;
判定Python版本是否符合设定值,对不符合的Python版本进行升级。
结合第一方面,在第一方面第二种可能的实现方式中,所述检查操作系统中的带有“NVIDIA”模块的属性值,使其属性值符合要求的具体过程为:
定义环境参数函数,设定GPU module的环境属性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810001686.4/2.html,转载请声明来源钻瓜专利网。