[发明专利]一种基于Kubernetes的推理服务系统有效
申请号: | 202010470862.6 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111629061B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 王超;吴韶华;陈清山;张荣国;林秀 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | H04L67/51 | 分类号: | H04L67/51;H04L67/1095;H04L67/10;H04L69/22;G06N5/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种基于Kubernetes的推理服务系统,包括:计算资源集群和推理服务平台;其中,推理服务平台包括:多框架模型模块,用于支持多种框架导出的模型;自定义镜像模块,用于获取用户发送的镜像文件,根据镜像文件进行部署,并执行推理服务,其中,镜像文件是用户将完成训练的模型和运行环境进行封装而得到的文件。可见,本申请将训练完成的模型和运行环境以镜像形式进行封装,提交到推理服务平台,推理服务平台通过参数传递形式进行线上推理服务的部署,不需要转换模型类型,也无需顾虑模型兼容性即可进行推理任务,提高了推理服务运行的效率。 | ||
搜索关键词: | 一种 基于 kubernetes 推理 服务 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010470862.6/,转载请声明来源钻瓜专利网。