[发明专利]一种设备的调度方法有效
申请号: | 201910734672.8 | 申请日: | 2019-08-09 |
公开(公告)号: | CN110471767B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N20/00 |
代理公司: | 北京律谱知识产权代理事务所(普通合伙) 11457 | 代理人: | 黄云铎 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 设备 调度 方法 | ||
1.一种设备的调度方法,其特征在于,所述调度方法适用于kubernetes系统框架对单元设备的调用,所述kubernetes系统框架连接有多个物理机,任一个所述物理机连接有多个所述单元设备,所述单元设备为机器学习单元,所述物理机上运行有设备插件,该调度方法包括:
步骤1,所述设备插件根据与所述物理机相连的所述单元设备的设备数量,确定所述单元设备的设备路径,并根据所述设备路径,获取所述单元设备的设备唯一标识符;
步骤2,所述设备插件将所述设备路径和所述设备唯一标识符关联,生成映射表,并调用设备管理工具库,根据所述设备路径获取所述单元设备的设备健康信息,将所述设备唯一标识符和所述设备健康信息发送至所述系统框架;
步骤3,所述系统框架判定所述设备健康信息正常时,所述设备插件根据所述映射表确定所述单元设备的设备路径,所述系统框架根据所述设备路径调用所述单元设备。
2.如权利要求1所述的设备的调度方法,其特征在于,所述映射表存储于所述设备插件。
3.如权利要求1所述的设备的调度方法,其特征在于,步骤1中获取所述单元设备的设备唯一标识符,具体包括:
步骤11,所述设备插件建立与所述机器学习单元之间的数据传输通道,并判断是否能够获取所述机器学习单元的设备唯一标识符,若不能够,执行步骤12,若能够,执行步骤13;
步骤12,根据随机生成函数,生成所述机器学习单元的所述设备唯一标识符;
步骤13,根据所述设备路径,确定该机器学习单元的所述设备唯一标识符。
4.如权利要求1所述的设备的调度方法,其特征在于,步骤2中,所述设备插件调用所述设备管理工具库,根据所述设备路径获取所述机器学习单元的所述设备健康信息,具体包括:
根据预设轮询周期,所述设备插件调用所述设备管理工具库提供的接口函数,所述设备管理工具库根据所述设备路径,获取所述设备健康信息。
5.如权利要求1所述的设备的调度方法,其特征在于,步骤3中,所述kubernetes框架判定所述设备健康信息正常的方法,具体包括:
所述kubernetes框架接收所述设备插件发送的grpc消息;
读取所述grpc消息的返回信息中的healthy字段,当判定所述healthy字段为true时,判定所述设备健康信息正常。
6.如权利要求1所述的设备的调度方法,其特征在于,步骤1中,确定所述单元设备的设备路径的步骤包括:
所述设备插件调用所述设备管理工具库,获得所述物理机连接的所述机器学习单元总数n,并生成所述机器学习单元的设备序号;
通过所述机器学习单元驱动预定的设备路径命名规则,根据设备路径前缀和所述设备序号,生成所述设备路径。
7.如权利要求1所述的设备的调度方法,其特征在于,该调度方法还包括:
当所述kubernetes框架接收到框架重启指令时,所述设备插件将检测到所述kubernetes框架的重启,并在所述kubernetes框架重启结束后重新连接至所述kubernetes框架。
8.如权利要求1至7中任一项所述的设备的调度方法,其特征在于,该调度方法还包括:
当所述机器学习单元与所述物理机断开连接时,释放所述机器学习单元占用的系统资源。
9.如权利要求8所述的设备的调度方法,其特征在于,该调度方法还包括:
所述设备插件调用测试桩工具库,并根据所述设备路径对所述机器学习单元进行测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910734672.8/1.html,转载请声明来源钻瓜专利网。