[发明专利]模型的确定方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202210725535.X | 申请日: | 2022-06-23 |
公开(公告)号: | CN115905851A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 贾敬伍;蒋宁;周长安 | 申请(专利权)人: | 北京中关村科金技术有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F16/332 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 秦贺余;柴国伟 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 确定 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请提供的一种模型的确定方法、装置、电子设备及计算机可读存储介质,通过将所述第一意图语料数据集输入至预先建立的第一模型中,确定所述第一意图语料数据集中各个意图语料数据对应的标签信息,然后基于所述第一意图语料数据集及所述第一意图语料数据集中各个意图语料数据对应的标签信息对所述第一模型进行训练,得到第二模型,基于所述第二模型的预测效果和所述第一模型的预测效果确定第一目标模型,能够避免得到的第一目标模型的预测效果变差。
技术领域
本申请涉及意图识别技术领域,特别地涉及一种模型的确定方法、装置、电子设备及计算机可读存储介质。
背景技术
对于对话系统、智能客服系统的搭建,意图识别是一项重要功能。当系统正式上线部署后,由于随时间增加会积累大量新增用户语句,或是由于客户业务变更,很多客户对意图识别模型进行再训练的能力提出了要求。相关技术中,将新增语料直接添加到训练数据中,进行再训练,但是可能会引入错误知识到现有模型中,导致预测效果变差,而且通常将新增语料直接添加到训练数据中,进行再训练,都是离线训练,不能满足时效性需求。
发明内容
针对上述相关技术中的问题,本申请提供一种模型的确定方法、装置、电子设备及计算机可读存储介质,能够避免得到的第一目标模型的预测效果变差。
本申请提供了一种模型的确定方法,所述方法包括:
获取第一意图语料数据集;
将所述第一意图语料数据集输入至预先建立的第一模型中,确定所述第一意图语料数据集中各个意图语料数据对应的标签信息;
基于所述第一意图语料数据集及所述第一意图语料数据集中各个意图语料数据对应的标签信息对所述第一模型进行训练,得到第二模型;并确定所述第二模型的预测效果;
基于所述第二模型的预测效果和所述第一模型的预测效果确定第一目标模型。
在一些实施例中,所述基于所述第二模型的预测效果和所述第一模型的预测效果确定第一目标模型,包括:
在所述第二模型的预测效果优于所述第一模型的预测效果的情况下,将所述第二模型确定为第一目标模型;
在所述第一模型的预测效果优于所述第二模型的预测效果的情况下,将所述第一模型确定为第一目标模型。
在一些实施例中,所述方法还包括:
获取第二意图语料数据集;
基于所述第二意图语料数据集训练初始模型以得到所述第一模型;
将所述第一模型和所述第一模型的预测效果进行保存。
在一些实施例中,所述方法还包括:
对所述第一意图语料数据集及所述第一意图语料数据集中各个意图语料数据对应的标签信息进行优化;
所述基于所述第一意图语料数据集及所述第一意图语料数据集中各个意图语料数据对应的标签信息对所述第一模型进行训练,包括:基于优化后的所述第一意图语料数据集及所述第一意图语料数据集中各个意图语料数据对应的标签信息对所述第一模型进行训练。
在一些实施例中,所述基于所述第二模型的预测效果和所述第一模型的预测效果确定第一目标模型,包括:
在所述第一模型的预测效果优于第二模型的预测效果的情况下,输出用于提示用户进行再次优化的提示信息;
在获取到再次优化后的所述第一意图语料数据集及所述第一意图语料数据集中各个意图语料数据对应的标签信息的情况下,通过再次优化后的所述第一意图语料数据集及所述第一意图语料数据集中各个意图语料数据对应的标签信息对所述第一模型进行训练,得到第三模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210725535.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于惩罚对偶分解法的深度展开信道译码方法及装置
- 下一篇:图像感测装置