[发明专利]模型的部署方法、装置、电子设备及存储介质在审
申请号: | 202210282208.1 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114611698A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 王泽楷;杨欣;罗洪运;朱制 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06N3/10 | 分类号: | G06N3/10;G06N3/08;G06N3/04;G06N5/04;G06N20/00;G06F8/60;G06F11/36 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 部署 方法 装置 电子设备 存储 介质 | ||
本公开涉及一种模型的部署方法、装置、电子设备及存储介质,所述部署方法包括:所述部署方法包括:根据预设的指令序列,调用至少一个目标模型;基于服务测试数据和所述目标模型,得到第一服务精度;在所述第一服务精度大于第二服务精度的情况下,生成部署请求。本公开实施例可实现自动化的模型部署方案,在电子设备确定目标模型在整体业务上的精度得到提升的情况下,可自动生成部署请求,不仅节约了人力成本,而且能够节省模型的部署流程耗时,进而使得模型能够快速地进行部署迭代,有利于人工智能模型应用于各种需要模型快速迭代的场景。
技术领域
本公开涉及计算机技术领域,尤其涉及一种模型的部署方法、装置、电子设备及存储介质。
背景技术
随着人工智能领域的发展,人工智能模型被应用于各类场景,而在人工智能模型的实际应用过程中,从模型训练到被部署至对应的电子设备中,其整体流程过于冗长,不仅效率低下,而且人工成本较高。
发明内容
本公开提出了一种模型的部署技术方案。
根据本公开的一方面,提供了一种模型的部署方法,所述部署方法包括:根据预设的指令序列,调用至少一个目标模型,所述目标模型是在待训练数据满足预设条件的情况下,基于所述待训练数据对初始模型训练得到的;基于服务测试数据和所述目标模型,得到第一服务精度;在所述第一服务精度大于第二服务精度的情况下,生成部署请求;其中,所述第二服务精度为基于所述服务测试数据和所述初始模型得到的精度,所述部署请求用于将目标模型部署至待部署设备。
在一种可能的实施方式中,所述预设条件包括:待训练数据的数量大于或等于预设数量、或待训练数据的数量与已训练数据的数量之间的比值大于或等于预设比值。
在一种可能的实施方式中,所述根据预设的指令序列,调用至少一个目标模型,包括:确定至少一个目标模型对应的接口配置信息;根据预设的指令序列,通过所述接口配置信息调用至少一个目标模型。
在一种可能的实施方式中,所述确定至少一个目标模型对应的接口配置信息,包括:转换目标模型为推理模型;根据所述推理模型对应的第一接口配置信息,确定目标模型对应的接口配置信息。
在一种可能的实施方式中,所述根据所述推理模型对应的第一接口配置信息,确定目标模型对应的接口配置信息,包括:确定所述推理模型对应的第一接口配置信息;云服务化所述第一接口配置信息,以生成第二接口配置信息,并将所述第二接口配置信息作为目标模型对应的接口配置信息。
在一种可能的实施方式中,所述转换目标模型为推理模型,包括:输入模型测试数据至目标模型,以获得第一模型精度;在所述第一模型精度大于第二模型精度的情况下,将目标模型转换为推理模型;其中,所述第二模型精度为输入所述模型测试数据至初始模型所得到的精度。
在一种可能的实施方式中,所述根据预设的指令序列,调用至少一个目标模型,包括:确定至少一个目标模型对应的接口配置信息之后,根据接口测试数据,确定所述接口配置信息的调用状态;在所述调用状态为异常状态的情况下,生成结束请求,所述结束请求用于停止调用目标模型。
在一种可能的实施方式中,所述基于服务测试数据和所述目标模型,得到第一服务精度,包括:发送所述接口配置信息至测试设备;接收所述测试设备发送的服务测试数据;根据预设的指令序列,基于服务测试数据和所述目标模型得到第一服务精度。
在一种可能的实施方式中,所述部署方法还包括:响应于所述部署请求,发送所述接口配置信息至待部署设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210282208.1/2.html,转载请声明来源钻瓜专利网。