[发明专利]一种基于小样本的迭代式增量对话意图类别识别方法有效
| 申请号: | 201910505469.3 | 申请日: | 2019-06-12 |
| 公开(公告)号: | CN110298391B | 公开(公告)日: | 2023-05-02 |
| 发明(设计)人: | 向阳;单光旭;贾圣宾;徐诗瑶;杨力 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F16/35;G06N3/0442;G06N3/0464;G06N3/047;G06N3/09 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 样本 迭代式 增量 对话 意图 类别 识别 方法 | ||
1.一种基于小样本的迭代式增量对话意图类别识别方法,其特征在于,该识别方法包括以下步骤:
步骤1:针对对话意图中的文本句子进行分词并训练得到词向量;
步骤2:针对一部分词向量先后利用LSTM网络和CNN网络特征提取后得到句子向量,将句子向量通过分类单元以训练初步分类模型,将另一部分词向量输入至训练完毕的初步分类模型,得到初步的分类结果;
步骤3:针对初步的分类结果,根据强化学习模型的回报进行筛选后通过XGBoost模型进行二次分类,并采用梯度下降的方法训练再次分类模型;
步骤4:利用整个分类模型训练过程中的分类错误样本重新输入训练一个新的初步分类模型,返回步骤3,针对新的初步分类模型以及所述再次分类模型进行迭代增量学习,原有的初步分类模型不变;
步骤5:在更新迭代增量学习过程中当初步分类模型的数量增长到预设阈值时,利用训练完毕的判别器模型,基于原有的初步分类模型进行相似度计算,并去除相似度最高的两个原有的初步分类模型其中之一以维持整体模型计算稳定性;
步骤6:循环执行步骤3至步骤5,逐步完善分类结果并得到最终对应识别类型结果。
2.根据权利要求1所述的一种基于小样本的迭代式增量对话意图类别识别方法,其特征在于,所述步骤2中的初步的分类结果中每一个类别的输出概率为:
式中,P(Xi|Dk)表示每一个类别的输出概率,Xi表示实际分类结果,Xi'表示预测分类结果,X表示所有分类结果。
3.根据权利要求1所述的一种基于小样本的迭代式增量对话意图类别识别方法,其特征在于,所述步骤2中的初步的分类结果中的损失函数为:
式中,y1表示初步分类模型输出结果中的损失函数,η1为调节参数,P表示真实意图类别标签概率,P'表示预测类别标签概率。
4.根据权利要求1所述的一种基于小样本的迭代式增量对话意图类别识别方法,其特征在于,所述的步骤3中的回报的计算公式为:
式中,R表示回报,ri表示当次回报,n和i均为自然数,ξ取0.95。
5.根据权利要求1所述的一种基于小样本的迭代式增量对话意图类别识别方法,其特征在于,所述的步骤2中的分类单元为全连接神经网络,所述的步骤2中的初步分类模型包括相互依次连接的句子向量提取层、对话向量提取层和分类层,所述步骤3中的再次分类模型包括相互连接的强化学习-模型筛选模块和决策树-分类模块,所述步骤5中的判别器模型为全连接神经网络。
6.根据权利要求1所述的一种基于小样本的迭代式增量对话意图类别识别方法,其特征在于,所述的步骤3中的针对初步的分类结果,根据回报进行筛选的过程对应损失函数为:
y3=p(Ai|F4i)*log(p'(Ai|F4i))
式中,y3表示针对初步分类模型输出结果根据回报进行筛选的过程对应损失函数,p(Ai|F4i)表示针对初步分类模型输出结果根据回报进行筛选的过程对应损失函数中下一个动作的概率,p'(Ai|F4i)表示针对初步分类模型输出结果根据回报进行筛选的过程对应损失函数中真实动作的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910505469.3/1.html,转载请声明来源钻瓜专利网。





