[发明专利]一种支持多GPU的计算型服务器的自动测试方法在审
申请号: | 201611240216.0 | 申请日: | 2016-12-28 |
公开(公告)号: | CN106649014A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 肖欢;韩超 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 济南舜源专利事务所有限公司37205 | 代理人: | 张亮 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 支持 gpu 计算 服务器 自动 测试 方法 | ||
技术领域
本发明涉及计算机软件开发领域,具体涉及一种支持多GPU的PCIE-SWITCH计算型服务器的自动检测方法,通过该方法对PCIE-SWITCH服务器进行测试,能够有效检测PCIE-SWITCH服务器存在的异常状况,可以减少人力、物力及流程管理的成本,提高测试覆盖率。
背景技术
目前在整机柜服务器领域,大型高性能、计算型服务器(PCIE-SWITCH)支持16张235瓦功率的GPU(Graphic Processing Unit图形处理器),通过PCIE(总线和接口标准Peripheral Component Interface Express)retimer卡(时间修正卡)和Mini SAS HD高速线缆外接一台服务器server使用,此时PCIE-SWITCH相当于服务器server端的PCIE设备,测试时PCIE-SWITCH也需要与服务器server联合测试。因为PCIE-SWITCH最多可支持16张GPU卡,当搭配Nvidia的GPU,使用NVQual工具测试GPU时,测试项较多、每个测试项较长,故工作量极大。
针对上述问题,本申请发明了一种支持多GPU的PCIE-SWITCH计算型服务器的自动化测试方法,能够自动进行PCIE-SWITCH服务器搭配GPU进行减耗(Thermal)、PCI Express频带宽度(bandwidth)、服务器承受压力Stress的测试,大大提高工作效率,从而有效地解决上述工作量巨大的问题。整个测试流程测试方法操作简单,自动化程度高,实用性较强,能够节省人力,提高测试效率,是验证产品质量的非常有效的方法。
发明内容
本发明是为提高计算型服务器(PCIE-SWITCH)自动化测试所做的。
本申请发明一种支持多GPU的PCIE-SWITCH计算型服务器的自动检测方法,该检测方法具体包括如下步骤:a、将PCIE-SWITCH服务器与server连接;b、开启PCIE-SWITCH服务器,1分钟后开启server;c、将测试主程序拷贝在server的操作系统下面;d、根据测试需求配置配置文件;e、运行测试主程序。
上述的自动检测方法,其特征还在于,是用MiniSASHD线缆将PCIE-SWITCH服务器与servet连接。所述的测试主程序具体包括如下步骤:
读取通过命令行输入的参数;
判断参数值,当参数值为f时,传递参数并读取配置文件;卸载操作系统自带的nvidia驱动,安装NVQual测试程序,并启动该测试程序进行GPU测试;
当参数值为h时,显示帮助信息;
当参数值为v时,显示版本信息;
当参数值为h、v、f以外的值时,显示错误信息。
上述的自动检测方法,其特征在于,所述的NVQual测试程序,具体包括以下步骤:
读取用户设置的减耗循环检测参数,根据用户设定的检测次数,对GPU进行thermal循环检测。
所述的NVQual测试程序,还包括以下步骤:
读取用户设置的序号参数,如果该参数为序号,则根据用户设定的序号,对该序号的GPU进行qualification测试;如果该参数为“all”,则对所有的GPU进行qualification测试。
所述的NVQual测试程序,还包括以下步骤:
读取用户设置的带宽参数,如果该参数为序号,则根据用户设定的序号,对该序号的GPU进行bandwidth的测试;如果该参数为“all”,则对所有的GPU进行bandwidth测试。
所述的NVQual测试程序,还包括以下步骤:
读取用户设置的压力循环检测参数,根据用户设定的检测次数,对GPU进行stress循环检测。
所述的NVQual测试程序,减耗循环检测参数可以设置成循环测试10个小时。
所述的NVQual测试程序,压力循环检测参数可以设置成循环测试12个小时。
上述的测试主程序结束后,收集日志信息,如果日志记录错误信息,则重新检测或者诊断故障原因。
附图说明
图1、测试主程序mian函数流程图
图2、NVQual测试程序流程图
具体实施方式
下面对本发明的内容进行更加详细的阐述:
发明主要包括四部分,第一部分为测试程序main函数的流程图,第二部分为NVQual测试程序流程图,第三部分为部分代码详解,最后一部分为使用说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611240216.0/2.html,转载请声明来源钻瓜专利网。