[发明专利]一种基于知识图谱和胶囊网络的小样本意图识别方法有效
申请号: | 202110660706.0 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113535950B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 姜明;曹凯强;张旻 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/279 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 胶囊 网络 样本 意图 识别 方法 | ||
1.一种基于知识图谱和胶囊网络的小样本意图识别方法,其特征在于包括以下步骤:
步骤(1)获取银行业务数据集并进行预处理,根据数据集中每条语句所属的意图,将数据集划分为10个子业务模块;
步骤(2)确定模型需识别的同业务意图和跨业务意图,并且设置训练规则;
步骤(3)建立基于知识图谱和胶囊网络的小样本意图识别架构,确定网络组成部分以及层数和维度,得到小样本意图识别模型;
步骤(4)将步骤(1)预处理后的语句输入双向LSTM模型,使语句中单词的表示能够获取语句的前后文信息;
步骤(5)利用实体识别工具识别出步骤(1)预处理后的语句中存在的实体,并且映射至知识图谱中对应的实体,抽取该实体相关联的知识表示向量;
步骤(6)利用注意力机制计算步骤(5)抽取到的每一个知识表示向量与语句中当前实体之间的关联程度;
步骤(7)根据步骤(4)中前一时刻的双向LSTM的隐藏层状态和当前时刻单词输入,得到上下文影响向量,并计算该向量与当前实体之间的关联程度;
步骤(8)先将知识表示向量与对应关联度相乘,后将上下文影响向量与对应影响权重值相乘,将两个相乘结果相加后与原先实体表示进行融合,得到新的实体表示;
步骤(9)利用胶囊网络将低层次的语句语义表示,映射到高维的意图特征表示;
步骤(10)基于步骤(4)至步骤(8)对未知语句进行操作后,得到未知语句表示,结合步骤(9)中的高维意图特征表示,对未知语句进行分类;
步骤(11)将预测的意图与语句对应的真实意图进行对比,计算损失函数,迭代更新网络模型中的参数;
步骤(12)将需测试的目标意图与对应的语句输入训练好的小样本意图识别模型,正确获得语句表示和高维意图特征表示,结合该高维意图特征表示对未知语句进行分类,输出未知语句对应的意图;
步骤(3)所述的小样本意图识别具体过程如下:
小样本意图识别模型主要由3个部分组成,分别为知识图谱增强语义表示层、动态路由映射层以及查询集语句分类计算层,每层的维度为256;知识图谱增强语义表示层由知识图谱和双向LSTM组成,动态路由映射层由胶囊网络组成;查询集语句分类计算层由多层感知机组成。
2.根据权利要求1所述的一种基于知识图谱和胶囊网络的小样本意图识别方法,其特征在于步骤(1)具体过程如下:
(1-1)采用单领域银行业务数据集banking 77,该数据集采样于银行线上真实的客服问答场景,并且已经通过手动转录的方式将用户的话语转换为文本;该数据集中共包含银行业务的77个意图和13083条语句,涉及了用户在银行中办理的大部分业务,并且正确标记了每一句语句对应的意图;
(1-2)根据银行业务划分准则,又对77个意图划分成10个子业务,分别有“银行卡业务,汇率业务,转账业务,存款业务,账户信息业务,手续费业务,取现业务,货币或银行卡兼容性业务,第三方设备业务,付款业务”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110660706.0/1.html,转载请声明来源钻瓜专利网。