[发明专利]多轮对话的意图分类方法及装置有效
申请号: | 202110458561.6 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113377933B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 黄林;黎华清;宋维林;赵航;张海峰 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轮对 意图 分类 方法 装置 | ||
本申请提供一种多轮对话的意图分类方法及装置,该方法包括:获取多轮对话的对话文本;将对话文本输入词向量模型,以输出多轮对话的对话文本词向量;提取出多轮对话中每一轮对话的对话文本词向量的特征向量;根据多轮对话中每一轮对话的特征向量,得到多轮对话的意图分类信息。与现有技术相比,本申请通过提取多轮对话中每一轮对话的特征向量,根据每一轮对话的特征向量得到意图分类信息的方法,既可以得到每一轮对话的特征,又可以结合上下文信息,提高了多轮对话的意图分类准确率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种多轮对话的意图分类方法及装置。
背景技术
意图分类是机器学习的一个重要领域。目前,智能客服会话的难点是进行用户意图匹配,只有明确了意图,才能给出针对性的回答。
目前,进行对话意图分类的方式有:用卡方检验选择特征词,然后计算特征词权重和关键句权重,然后通过分类器进行意图分类;采用卷积神经网络进行对话意图分类。
但是,通过卡方检验选择特征词然后通过分类器进行分类的方式,只是计算词在句子中的重要性,并未考虑词对分类结果的重要性,分类的准确率低;通过卷积神经网络进行对话意图分类的方法,可以很好的把握局部重要信息,但是缺乏上下文信息,意图分类的准确率低。因此,现有的技术方案存在多轮对话的意图分类的准确率低的问题。
发明内容
本申请实施例提供一种多轮对话的意图分类方法及装置,以解决现有技术中多轮对话的意图分类的准确率低的问题。
本申请的第一方面提供一种多轮对话的意图分类方法,包括:
获取多轮对话的对话文本;
将所述对话文本输入词向量模型,以输出所述多轮对话的对话文本词向量;
提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量;
根据所述多轮对话中每一轮对话的特征向量,得到所述多轮对话的意图分类信息。
在一种可选的实施方式中,所述提取出所述多轮对话中每一轮对话的对话文本词向量的特征向量,包括:
将所述多轮对话中每一轮对话的对话文本词向量输入特征向量提取模型,以输出每一轮对话的特征向量。
在一种可选的实施方式中,所述将所述多轮对话中每一轮对话的对话文本词向量输入特征向量提取模型,以输出每一轮对话的特征向量,包括:
根据所述多轮对话的对话文本词向量得到所述多轮对话的对话文本矩阵;
将所述对话文本矩阵输入卷积神经网络模型,以输出的所述多轮对话中每一轮对话的特征向量。
在一种可选的实施方式中,所述根据所述多轮对话的对话文本词向量得到所述多轮对话的对话文本矩阵,包括:
根据所述多轮对话的对话次数、所述对话文本的句长以及所述对话文本词向量的向量维度,将所述多轮对话的对话文本词向量转换为所述多轮对话的对话文本矩阵,所述句长表征所述多轮对话中每一轮对话的长度。
在一种可选的实施方式中,所述根据所述多轮对话中每一轮对话的特征向量,得到所述多轮对话的意图分类信息,包括:
将所述多轮对话中每一轮对话的特征向量输入循环神经网络模型,以输出所述多轮对话的意图向量;
根据所述意图向量确定所述多轮对话的意图分类信息。
在一种可选的实施方式中,在所述获取多轮对话的对话文本之前,所述方法还包括:
获取所述多轮对话的待处理对话文本;
对所述多轮对话的待处理对话文本进行过滤,得到所述多轮对话的第一对话文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110458561.6/2.html,转载请声明来源钻瓜专利网。