[发明专利]意图分类模型的训练方法、分类方法、系统、设备和介质有效

申请号：	201811333427.8	申请日：	2018-11-09
公开（公告）号：	CN109492104B	公开（公告）日：	2023-01-31
发明（设计）人：	杨俊	申请（专利权）人：	北京汇钧科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F16/36
代理公司：	上海弼兴律师事务所 31283	代理人：	薛琦;罗朗
地址：	100176 北京市大兴区北京经济***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	意图分类模型训练方法系统设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种意图分类模型的训练方法、分类方法、系统、设备和介质，其中，训练方法包括：获取多组原始数据，每组原始数据包括用户的输入内容以及所述用户的行为数据；标注每组原始数据中输入内容的意图类别；根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据；根据所述多组训练数据训练所述意图分类模型，所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。本发明综合了用户各维度的特征，并基于深度学习训练了意图分类模型。根据该意图分类模型，可以准确地识别用户输入内容的意图类别，进而人机交互过程中能够准确获知用户的意图类别，并根据识别出的意图类别生成针对性应答。

技术领域

本发明涉及互联网技术领域，尤其涉及一种用户意图的识别方法、系统、电子设备和存储介质。

背景技术

随着互联网技术的快速发展，网上购物逐渐渗透到人们生活的方方面面，因此，互联网用户对于客服人员的需求也越来越多。又由于人工客服存在培训周期长且人力成本高的问题，智能客服机器人因其无需培训、无需人力成本且能够持续不间断地工作而已经越来越多地替代了人工客服。

目前，智能客服机器人的核心工作在于，对用户输入进行预处理(包括纠错、分词、命名实体识别等)，然后对预处理结果进行意图识别分类，再根据分类结果进行应答。然而，由于上述工作过程仅考虑用户输入而不涉及用户自身特征(例如用户画像、历史订单信息等)，从而容易导致智能客服机器人未能准确进行意图识别，进而也就不能准确对于用户输入进行应答。

例如，用户输入为“为什么我买的东西还没到？”，对于该种场景存在两种可能性，其一，未发货，其二，货品仍处于配送中，因此，智能客服机器人仅基于用户输入难以正确就用户意图进行识别，也就难以针对性地应答用户输入。

发明内容

本发明要解决的技术问题是为了克服现有技术中智能客服机器人仅基于用户输入来识别用户意图的缺陷，提供一种用户意图的识别方法、系统、电子设备和存储介质。

本发明是通过下述技术方案来解决上述技术问题：

一种意图分类模型的训练方法，其特点在于，所述训练方法包括：

获取多组原始数据，每组原始数据包括用户的输入内容以及所述用户的行为数据；

标注每组原始数据中输入内容的意图类别；

根据所述多组原始数据以及所述多组原始数据中输入内容的意图类别构造多组训练数据；

根据所述多组训练数据训练所述意图分类模型，所述意图分类模型用于根据原始数据生成所述原始数据中输入内容的意图类别。

较佳地，所述构造多组训练数据的步骤包括：

对于每组原始数据，将行为数据输入决策树；

所述决策树输出所述行为数据的组合特征；