[发明专利]自定义模型的发布方法、装置、设备及介质在审
申请号: | 202211084108.4 | 申请日: | 2022-09-06 |
公开(公告)号: | CN115599401A | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 陈嘉良 | 申请(专利权)人: | 深圳前海环融联易信息科技服务有限公司 |
主分类号: | G06F8/61 | 分类号: | G06F8/61;G06F8/71 |
代理公司: | 深圳众鼎汇成知识产权代理有限公司 44566 | 代理人: | 朱业刚 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自定义 模型 发布 方法 装置 设备 介质 | ||
本申请适用于发布服务技术领域,尤其涉及一种自定义模型的发布方法、装置、设备及介质。该发布方法应用在镜像中,在该镜像中通过固化相应的逻辑功能,实现从代码库中拉取自定义模型对应的源代码和运行环境配置文件,执行运行环境配置文件,将镜像的环境修改为目标运行环境,验证目标运行环境,在目标运行环境的验证结果为正常时,基于源代码启动发布服务,以发布源代码,从而实现对自定义模型的发布,发布过程在镜像中完成,省去了制作镜像和打包的过程,可以有效地减少耗时,且在模型发布之前即可对运行环境进行配置,采用拉取代码和配置文件的方式可及时修正运行环境和变更代码,进而提高了发布效率。
技术领域
本申请适用于模型发布服务技术领域,尤其涉及一种自定义模型的发布方法、装置、设备及介质。
背景技术
目前,自定义模型是机器学习在实际商业运用中重要的表现形式之一。自定义模型在商业中使用需要研发者对该自定义模型进行发布即持续集成和交付,随后才能够供给用户使用。当前的自定义模型的发布需要包括以下步骤:编写自定义模型的实现代码、编写DockFile、打包并制作镜像、镜像发布服务等。上述发布过程一般基于kserve进行,kserve是一个基于kubernete的开源模型推理服务平台,可以提供高性能、可伸缩、以及智能路由的模型服务,支持sklearn、tensorflow、pytorch及自定义模型等多种框架和模型格式,但上述发布和验证流程冗长、制作镜像耗时较长,带来了发布效率低下、运行环境异常排查困难等问题。因此,如何优化自定义模型的发布流程,以提高发布效率成为亟待解决的问题。
发明内容
有鉴于此,本申请实施例提供了一种自定义模型的发布方法、装置、设备及介质,以解决如何优化自定义模型的发布流程,以提高发布效率的问题。
第一方面,本申请实施例提供一种自定义模型的发布方法,所述发布方法应用在镜像中,所述发布方法包括:
从代码库中拉取所述自定义模型对应的源代码和运行环境配置文件;
执行所述运行环境配置文件,将所述镜像的环境修改为目标运行环境;
验证所述目标运行环境,在所述目标运行环境的验证结果为正常时,基于所述源代码启动发布服务,以发布所述源代码。
在一实施方式中,执行所述运行环境配置文件,将所述镜像的环境修改为目标运行环境包括:
将所述运行环境配置文件与所述镜像的环境进行差异比对,得到差异结果;
基于所述差异结果对所述镜像的环境进行修改,得到目标运行环境。
在一实施方式中,在从代码库中拉取所述自定义模型对应的源代码和运行环境配置文件之前,还包括:
启动所述镜像中command组件或args组件,以获取代码库的配置参数信息;
解析所述配置参数信息,确定所述代码库的拉取地址;
从代码库中拉取所述自定义模型对应的源代码和运行环境配置文件包括:
基于所述拉取地址,从代码库中拉取所述自定义模型对应的源代码和运行环境配置文件。
在一实施方式中,在基于所述源代码启动发布服务,以发布所述源代码之后,还包括:
在检测到所述自定义模型对应的源代码变更时,从所述代码库拉取变更后的源代码;
基于所述变更后的源代码启动发布服务,以发布所述变更后的源代码。
在一实施方式中,在基于所述源代码启动发布服务之后,还包括:
验证所述发布服务;
在所述发布服务的验证结果为正常时,确定发布成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海环融联易信息科技服务有限公司,未经深圳前海环融联易信息科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211084108.4/2.html,转载请声明来源钻瓜专利网。