[发明专利]意图分类模型的训练方法、分类方法、系统、设备和介质有效
申请号: | 201811333427.8 | 申请日: | 2018-11-09 |
公开(公告)号: | CN109492104B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 杨俊 | 申请(专利权)人: | 北京汇钧科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;罗朗 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 分类 模型 训练 方法 系统 设备 介质 | ||
本发明公开了一种意图分类模型的训练方法、分类方法、系统、设备和介质,其中,训练方法包括:获取多组原始数据,每组原始数据包括用户的输入内容以及所述用户的行为数据;标注每组原始数据中输入内容的意图类别;根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据;根据所述多组训练数据训练所述意图分类模型,所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。本发明综合了用户各维度的特征,并基于深度学习训练了意图分类模型。根据该意图分类模型,可以准确地识别用户输入内容的意图类别,进而人机交互过程中能够准确获知用户的意图类别,并根据识别出的意图类别生成针对性应答。
技术领域
本发明涉及互联网技术领域,尤其涉及一种用户意图的识别方法、系统、电子设备和存储介质。
背景技术
随着互联网技术的快速发展,网上购物逐渐渗透到人们生活的方方面面,因此,互联网用户对于客服人员的需求也越来越多。又由于人工客服存在培训周期长且人力成本高的问题,智能客服机器人因其无需培训、无需人力成本且能够持续不间断地工作而已经越来越多地替代了人工客服。
目前,智能客服机器人的核心工作在于,对用户输入进行预处理(包括纠错、分词、命名实体识别等),然后对预处理结果进行意图识别分类,再根据分类结果进行应答。然而,由于上述工作过程仅考虑用户输入而不涉及用户自身特征(例如用户画像、历史订单信息等),从而容易导致智能客服机器人未能准确进行意图识别,进而也就不能准确对于用户输入进行应答。
例如,用户输入为“为什么我买的东西还没到?”,对于该种场景存在两种可能性,其一,未发货,其二,货品仍处于配送中,因此,智能客服机器人仅基于用户输入难以正确就用户意图进行识别,也就难以针对性地应答用户输入。
发明内容
本发明要解决的技术问题是为了克服现有技术中智能客服机器人仅基于用户输入来识别用户意图的缺陷,提供一种用户意图的识别方法、系统、电子设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
一种意图分类模型的训练方法,其特点在于,所述训练方法包括:
获取多组原始数据,每组原始数据包括用户的输入内容以及所述用户的行为数据;
标注每组原始数据中输入内容的意图类别;
根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据;
根据所述多组训练数据训练所述意图分类模型,所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。
较佳地,所述构造多组训练数据的步骤包括:
对于每组原始数据,将行为数据输入决策树;
所述决策树输出所述行为数据的组合特征;
将所述组合特征转换成组合特征向量;
利用所述组合特征向量构造训练数据。
较佳地,所述将所述组合特征转换成组合特征向量的步骤包括:
利用one-hot转换所述组合特征,得到组合特征向量。
较佳地,构造训练数据的步骤包括:
对于每组原始数据,对输入内容进行命名实体识别,得到若干实体;
将所述若干实体转换成实体特征向量;
对行为数据进行清洗,得到行为特征;
将所述行为特征转换成行为特征向量;
利用所述实体特征向量和所述行为特征向量构造训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京汇钧科技有限公司,未经北京汇钧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811333427.8/2.html,转载请声明来源钻瓜专利网。