[发明专利]一种整机柜计算资源池节点及计算资源池化架构在审
申请号: | 201710433600.0 | 申请日: | 2017-06-09 |
公开(公告)号: | CN107239346A | 公开(公告)日: | 2017-10-10 |
发明(设计)人: | 郭猛 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 孟峣 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 整机 计算 资源 节点 架构 | ||
1.一种整机柜计算资源池节点,其特征在于,以1U节点的形态应用到配置有管理模块、计算节点的整机柜服务器,其结构包括电源板、GPU节点模块和GPU,所述GPU节点模块通过电源板连接到上述管理模块,实现对GPU节点模块状态监控和计算资源的管理功能;在GPU节点模块中配置有数据交换芯片,该数据交换芯片可连接所述计算节点、GPU并实现GPU与计算节点之间计算数据的交换。
2.根据权利要求1所述的一种整机柜计算资源池节点,其特征在于,所述电源板与GPU节点模块之间采用铜排供电,供电电压为12V。
3.根据权利要求1所述的一种整机柜计算资源池节点,其特征在于,所述数据交换芯片配置2个数据上行接口和4个数据下行接口,4个数据下行接口分别接入4个GPU,1个数据上行接口可接入计算节点,该数据上行接口、数据下行接口均为PCIE接口。
4.根据权利要求3所述的一种整机柜计算资源池节点,其特征在于,所述GPU节点模块中还配置有顺序互连的BMC芯片、MCPU芯片和PCIE Switch芯片,该PCIE Switch芯片连接上述数据交换芯片且还连接有可扩展的对外管理接口,该对外管理接口为PCIE接口。
5.根据权利要求4所述的一种整机柜计算资源池节点,其特征在于,所述计算资源池节点可用于级联,即将至少两个GPU节点模块互联,具体级联结构为:首先将一GPU节点模块的上行接口接入计算节点,该GPU节点模块的另一上行接口则接入另一GPU节点模块的一上行接口;两GPU节点模块之间的对外管理接口相互连通,实现PCIE管理信号的互通;该另一GPU节点模块与其它GPU节点模块之间则采用上述连接方式实现级联。
6.根据权利要求4或5所述的一种整机柜计算资源池节点,其特征在于,在与计算节点连接的GPU节点模块中,通过MCPU实现对GPU节点模块的管理,MCPU芯片通过1个PCIE Switch芯片连接到对外管理接口和数据交换芯片,通过BMC芯片实现上行管理通道为1和2的动态选择,即选择哪个数据上行接口,当计算节点模块为被级联模块时,管理链路切换到通道1,保持1个MCPU进行2个或N个GPU节点模块的管理,这里的N为被级联模块的数量,从而实现GPU节点模块的级联。
7.一种整机柜计算资源池化架构,其特征在于,包括一个计算节点、若干GPU节点模块、整机柜管理模块及整机柜电源总线BUSBAR,计算节点和GPU节点模块分别通过各自的电源板连接到整机柜电源总线BUSBAR取电,实现计算资源池的集中供电;整机柜管理模块用于实现对整机柜计算资源池的集中管理,计算节点用于作为计算资源池的主设备端,通过线缆分别连接到各GPU节点模块并传输PCIE数据信号。
8.根据权利要求7所述的一种整机柜计算资源池化架构,其特征在于,所述计算节点、GPU节点中的BMC芯片分别通过各自的电源板与整机柜管理模块通信,从而实现计算资源池的集中管理;该整机柜管理模块用于收集计算节点和GPU节点模块的资源信息、资源利用率,并上报给该整机柜管理模块中的上层应用软件。
9.根据权利要求8所述的一种整机柜计算资源池化架构,其特征在于,所述整机柜管理模块与监控芯片BMC通信获取的资源信息包括CPU利用率、GPU利用率、网络带宽,并将资源池中资源利用率及时上报给上层应用软件。
10.根据权利要求9所述的一种整机柜计算资源池化架构,其特征在于,所述系统上层应用软件将获取的所有GPU资源统一编码、管理,形成GPU资源池,并根据具体的相关资源利用率,计算GPU资源池中各GPU的业务饱和度,有效调整资源池业务应用,实现资源动态池化,同时可自动分配新运算任务,实现节点资源的最大化使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710433600.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及装置
- 下一篇:一种虚拟化场景下的设备资源分配方法和装置