[发明专利]一种基于小样本的迭代式增量对话意图类别识别方法有效
| 申请号: | 201910505469.3 | 申请日: | 2019-06-12 |
| 公开(公告)号: | CN110298391B | 公开(公告)日: | 2023-05-02 |
| 发明(设计)人: | 向阳;单光旭;贾圣宾;徐诗瑶;杨力 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F16/35;G06N3/0442;G06N3/0464;G06N3/047;G06N3/09 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及一种基于小样本的迭代式增量对话意图类别识别方法,该方法基于小样本数据集,从一个初步分类模型开始训练,随着模型的使用,初步模型的数量不断增多,模型准确率也逐步提升,摒弃了以往深度学习模型需要大量样本的训练方式,该方法在迭代训练过程中由于每次只需要少量样本训练一个新的初步分类模型,其他已有的历史初步分类模型权重不变,然后将全部的初步分类模型的结果输入再次分类模型中进行训练,模型的计算速度不会随着样本数量的增加而降低,同时相似度筛选模型会对已有的初步分类模型进行筛选和剔除,在保证准确率的情况下维持了性能,与现有技术相比,本发明具有训练样本数量少,计算性能稳定,模型易于更新扩展等优点。 | ||
| 搜索关键词: | 一种 基于 样本 迭代式 增量 对话 意图 类别 识别 方法 | ||
【主权项】:
1.一种基于小样本的迭代式增量对话意图类别识别方法,其特征在于,该识别方法包括以下步骤:步骤1:针对对话意图中的文本句子进行分词并训练得到词向量;步骤2:针对一部分词向量先后利用LSTM网络和CNN网络特征提取后得到句子向量,将句子向量通过分类单元以训练初步分类模型,将另一部分词向量输入至训练完毕的初步分类模型,得到初步的分类结果;步骤3:针对初步的分类结果,根据强化学习模型的回报进行筛选后通过XGBoost模型进行二次分类,并采用梯度下降的方法训练再次分类模型;步骤4:利用整个分类模型训练过程中的分类错误样本重新输入训练一个新的初步分类模型,返回步骤3,进行迭代增量学习;步骤5:在更新迭代增量学习过程中当初步分类模型的数量增长到预设阈值时利用训练完毕的判别器模型进行相似度计算,并去除相似度最高的两个模型其中之一以维持整体模型计算稳定性;步骤6:循环执行步骤3至步骤5,逐步完善分类结果并得到最终对应识别类型结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910505469.3/,转载请声明来源钻瓜专利网。





