[发明专利]一种基于小样本的迭代式增量对话意图类别识别方法有效

专利信息
申请号: 201910505469.3 申请日: 2019-06-12
公开(公告)号: CN110298391B 公开(公告)日: 2023-05-02
发明(设计)人: 向阳;单光旭;贾圣宾;徐诗瑶;杨力 申请(专利权)人: 同济大学
主分类号: G06F18/241 分类号: G06F18/241;G06F16/35;G06N3/0442;G06N3/0464;G06N3/047;G06N3/09
代理公司: 上海科盛知识产权代理有限公司 31225 代理人: 赵继明
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 样本 迭代式 增量 对话 意图 类别 识别 方法
【说明书】:

发明涉及一种基于小样本的迭代式增量对话意图类别识别方法,该方法基于小样本数据集,从一个初步分类模型开始训练,随着模型的使用,初步模型的数量不断增多,模型准确率也逐步提升,摒弃了以往深度学习模型需要大量样本的训练方式,该方法在迭代训练过程中由于每次只需要少量样本训练一个新的初步分类模型,其他已有的历史初步分类模型权重不变,然后将全部的初步分类模型的结果输入再次分类模型中进行训练,模型的计算速度不会随着样本数量的增加而降低,同时相似度筛选模型会对已有的初步分类模型进行筛选和剔除,在保证准确率的情况下维持了性能,与现有技术相比,本发明具有训练样本数量少,计算性能稳定,模型易于更新扩展等优点。

技术领域

本发明涉及计算机技术领域,尤其是涉及一种基于小样本的迭代式增量对话意图类别识别方法。

背景技术

为提升产品和服务的质量,很多公司推出了自己的客服系统,通过人工客服帮助用户解答问题,使用户享受更完善的服务,提高了服务质量和效率,但是随着产品用户数量的增加,传统的人工客服不能满足众多用户的需求,而且人工客服需要专门的对业务进行培训学习,也带来了一定的成本,客服热线长期处于占线的状态,会影响用户的体验度。因此各大公司推出了自己的人工客服产品,通过学习历史客服与用户之间的聊天信息,提取出对话中所含的意图信息,能够更快的帮助用户解决相关的业务。

对话意图识别就是通过理解人与人之间的聊天语料信息,对文本中的意图特征进行检索,过滤和分类等,最终识别出用户对话所包含的目的甚至情感,意图识别的核心是对语义的理解。基于机器学习的对话意图识别方法包含基于规则和统计的对话意图识别,基于机器学习分类器的对话意图识别以及基于生成式模型的对话意图识别等。电信行业采用的智能客服机器人可以通过与用户的对话快速的理解用户所需要办理的业务内容,给出用户选择项,减轻用户的检索负担。

近几年,随着深度学习的逐步发展,越来越多的科技公司推出了自己的聊天产品,比如苹果公司的Siri,微软小娜,以及科大讯飞的语音助手等等,这些人机对话的目的最终是要理解用户的意图,给予用户反馈帮助用户享受更好的服务,这些都离不开对用户意图的识别算法。但是往往有些聊天机器人由于自身学习能力较差,很难理解用户深层次的问题,导致出现答非所问甚至循环回答的现象,因此目前的意图识别算法还有待完善和提高。

最近几年对话意图识别中比较成熟的算法有基于规则匹配的意图识别算法,基于概率统计模型的文档分类算法,以及采用SVM(支持向量机),KNN(k-邻域),决策树模型的文本分类算法等等。基于规则的算法往往是通过统计文本中关键词的信息,粗略的推测用户的意图,这种分类方式在数据量较大的情况下查询较慢,而且需要人工标注,耗时耗力;基于概率统计模型的文档分类算法对于文本的质量和分布要求较高,而且在小样本的情况下分类不准;基于机器学习分类模型的文本分类算法对于短文本分类效果较好,对于长文本来说很难捕捉对话上下文信息,容易出现答非所问的情况,而且对于新的预料需要重新训练模型,随着样本数目的增多,训练复杂度较大。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于小样本的迭代式增量对话意图类别识别方法。

本发明的目的可以通过以下技术方案来实现:

一种基于小样本的迭代式增量对话意图类别识别方法,该识别方法包括以下步骤:

步骤1:针对对话意图中的文本句子进行分词并训练得到词向量;

步骤2:针对一部分词向量先后利用LSTM网络和CNN网络特征提取后得到句子向量,将句子向量通过分类单元以训练初步分类模型,将另一部分词向量输入至训练完毕的初步分类模型,得到初步的分类结果;

步骤3:针对初步的分类结果,根据强化学习模型的回报进行筛选后通过XGBoost模型进行二次分类,并采用梯度下降的方法训练再次分类模型;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910505469.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top