[发明专利]一种意图识别模型训练方法、计算机设备及存储介质在审
申请号: | 202310151466.0 | 申请日: | 2023-02-07 |
公开(公告)号: | CN116204639A | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 余治伦;刘欢;徐伟;林昊;邬稳;邓文强 | 申请(专利权)人: | 招联消费金融有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F18/23 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 黄禹强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 意图 识别 模型 训练 方法 计算机 设备 存储 介质 | ||
本申请实施例公开一种意图识别模型训练方法、计算机设备及存储介质,可应用于人工智能、云技术及物联网等场景。该方法包括:获取第一文本数据和第二文本数据;第一文本数据为未标注意图类型的文本数据,第二文本数据为已标注意图类型的参考文本数据;对第一文本数据进行意图识别,得到第三文本数据;第三文本数据具有第一意图类型的标签;对第一文本数据进行聚类处理,得到第四文本数据;第四文本数据具有第二意图类型的标签;基于第二文本数据、第三文本数据和第四文本数据,对第一意图识别模型进行训练,得到第二意图识别模型。采用本申请实施例,可以提高意图识别模型的准确率。
技术领域
本申请涉及计算机技术领域,尤其涉及一种意图识别模型训练方法、计算机设备及存储介质。
背景技术
在意图识别过程中,系统需要大量的已标注文本数据对初始模型进行构建和训练,以实现更高的意图识别准确率。然而,系统所需的已标注文本数据却难以获取。目前,基于伪标签的半监督学习训练的过程中,通常使用少量的已标注文本数据对初始模型进行训练,并通过训练后的初始模型对大量的未标注文本数据进行意图识别,以得到大量的具有伪标签的文本数据,从而基于少量的已标注文本数据和大量的具有伪标签的文本数据,对训练后的初始模型进行训练,进而得到意图识别模型。但是,通过训练后的初始模型所生成的伪标签可能不够准确,若基于具有不够准确的伪标签的文本数据训练得到意图识别模型,则会使得意图识别模型不够准确。
发明内容
本发明实施例提供了一种意图识别模型训练方法、计算机设备及存储介质,可以提高意图识别模型的准确率,从而提高意图识别的准确性。
本申请实施例一方面提供了一种意图识别模型训练方法,该方法包括:
获取第一文本数据和第二文本数据;第一文本数据为未标注意图类型的文本数据,第二文本数据为已标注意图类型的参考文本数据;
对第一文本数据进行意图识别,得到第三文本数据;第三文本数据具有第一意图类型的标签;
对第一文本数据进行聚类处理,得到第四文本数据;第四文本数据具有第二意图类型的标签;
基于第二文本数据、第三文本数据和第四文本数据,对第一意图识别模型进行训练,得到第二意图识别模型。
本申请实施例一方面提供了一种意图识别模型训练装置,包括:
获取模块,用于获取第一文本数据和第二文本数据;第一文本数据为未标注意图类型的文本数据,第二文本数据为已标注意图类型的参考文本数据;
处理模块,用于对第一文本数据进行意图识别,得到第三文本数据;第三文本数据具有第一意图类型的标签;对第一文本数据进行聚类处理,得到第四文本数据;第四文本数据具有第二意图类型的标签;
训练模块,用于基于第二文本数据、第三文本数据和第四文本数据,对第一意图识别模型进行训练,得到第二意图识别模型。
本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行本申请实施例提供的意图识别模型训练方法。
本申请实施例一方面提供了一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行本申请实施例提供的意图识别模型训练方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中,计算机指令被计算机设备的处理器执行时,执行本申请实施例提供的意图识别模型训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招联消费金融有限公司,未经招联消费金融有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310151466.0/2.html,转载请声明来源钻瓜专利网。