[发明专利]模型训练方法及装置在审
申请号: | 202010049320.1 | 申请日: | 2020-01-16 |
公开(公告)号: | CN113128686A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 刘志飘 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N20/00 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 | ||
1.一种模型训练方法,其特征在于,应用于包括第一服务器和第二服务器的系统中,所述第一服务器位于私有云中,用于模型推理;所述第二服务器位于公有云中,用于模型训练;所述方法包括:
所述第一服务器从所述第二服务器获取第一训练模型;
所述第一服务器将输入数据输入所述第一训练模型中进行模型推理,得到推理结果;
所述第一服务器根据所述推理结果,按照模型评估指标对所述第一训练模型进行评估,得到模型评估指标的评估结果;
若至少一项模型评估指标的评估结果未超过其对应的预设阈值,则所述第一服务器向所述第二服务器发送针对所述第一训练模型的重训练指令,所述重训练指令用于指示所述第二服务器对所述第一训练模型进行重训练。
2.根据权利要求1所述的模型训练方法,其特征在于,在所述第一服务器将输入数据输入所述第一训练模型中进行模型推理,得到推理结果之后,所述方法还包括:
所述第一服务器向所述第二服务器发送所述输入数据和所述推理结果;所述输入数据和所述推理结果用于对所述第一训练模型进行重训练。
3.根据权利要求1或2所述的模型训练方法,其特征在于,所述模型评估指标包括以下至少一项:推理结果的准确率、推理结果的查准率、推理结果的召回率、推理结果的F1分数F1-Score、推理结果的接收者操作特征曲线ROC下的面积AUC。
4.根据权利要求1-3中任一项所述的模型训练方法,其特征在于,若模型评估指标的评估结果均超过其对应的预设阈值,则所述第一服务器不向所述第二服务器发送针对所述第一训练模型的重训练指令。
5.一种模型训练方法,其特征在于,应用于包括第一服务器和第二服务器的系统中,所述第一服务器位于私有云中,用于模型推理;所述第二服务器位于公有云中,用于模型训练;所述方法包括:
所述第二服务器从所述第一服务器获取针对第一训练模型的重训练指令、输入数据以及推理结果,所述重训练指令用于指示所述第二服务器对所述第一训练模型进行重训练,所述输入数据为所述第一服务器输入第一训练模型中的数据,所述推理结果为所述第一服务器将输入数据输入所述第一训练模型中进行模型推理后得到的结果;
所述第二服务器根据所述输入数据以及所述推理结果,确定重训练样本集;
所述第二服务器根据所述重训练样本集对所述第一训练模型进行重训练,确定第二训练模型,所述第二训练模型用于替换所述第一训练模型;
所述第二服务器向所述第一服务器发送所述第二训练模型。
6.根据权利要求5所述的模型训练方法,其特征在于,所述第二服务器从所述第一服务器获取针对第一训练模型的重训练指令、输入数据以及推理结果,具体包括:
所述第二服务器响应于从所述第一服务器接收到的所述重训练指令,获取所述输入数据和所述推理结果。
7.根据权利要求5或6所述的模型训练方法,其特征在于,所述第二服务器根据所述输入数据以及所述推理结果,确定重训练样本集,具体包括:
所述第二服务器对所述输入数据进行标注,得到标注后的输入数据;
所述第二服务器将所述标注后的输入数据和所述推理结果存储到重训练样本集中。
8.根据权利要求7所述的模型训练方法,其特征在于,在所述第二服务器对所述输入数据进行标注,得到标注后的输入数据之前,还包括:
若所述推理结果为正确的推理结果,则所述第二服务器保留所述推理结果和所述推理结果对应的输入数据;
若所述推理结果为错误的推理结果,则所述第二服务器删除所述推理结果和所述推理结果对应的输入数据,或者,所述第二服务器将所述推理结果替换为所述输入数据对应的正确的推理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010049320.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双馈风机变流器控制系统测试平台
- 下一篇:吸尘器的收纳站及吸尘器组件