[发明专利]多意图识别模型训练方法和多意图识别方法及相关装置在审
| 申请号: | 202010951226.5 | 申请日: | 2020-09-11 |
| 公开(公告)号: | CN111984780A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 黄石磊;张剑 | 申请(专利权)人: | 深圳市北科瑞声科技股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/30;G06N3/04 |
| 代理公司: | 深圳市万商天勤知识产权事务所(普通合伙) 44279 | 代理人: | 罗建平 |
| 地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 意图 识别 模型 训练 方法 相关 装置 | ||
1.一种多意图识别模型训练方法,其特征在于,包括:
编码步骤:对训练数据进行编码,得到训练数据中的每条对话文本的编码向量,并计算每条对话文本的带有上下文相关的语境信息的特征向量;
控制步骤:针对每一条对话文本,判断是否需要引入上下文相关的语境信息;
分类训练步骤:针对每一条对话文本,若控制步骤判断为是,则将该条对话文本的编码向量及其带有上下文相关的语境信息的特征向量结合后输入分类器;否则,直接将该条对话文本的编码向量输入分类器;通过分类器训练,得到用于对对话文本的意图进行分类识别的多标签分类模型。
2.根据权利要求1所述的方法,其特征在于,
所述编码步骤具体包括:采用深度学习预训练模型对训练数据进行编码,得到训练数据中的每条对话文本的编码向量VQ3,以及,对于每条对话文本,使用一个滑动窗口获取包括该条对话文本在内的多轮对文文本,将滑动窗口内所有对话文本的编码向量加权求和,得到该条对话文本的带有上下文相关的语境信息的特征向量,记为VH。
3.根据权利要求2所述的方法,其特征在于,
所述控制步骤具体包括:针对每一条对话文本,根据该条对话文本的编码向量VQ3及其带有上下文相关的语境信息的特征向量VH进行状态值计算,计算公式为:S=sigmoid(WS*[VQ3,VH]),其中,WS为经验参数;根据状态值S是否超过预设值,判断是否需要引入上下文相关的语境信息。
4.根据权利要求2所述的方法,其特征在于,在所述分类训练步骤中,所述将该条对话文本的编码向量及其带有上下文相关的语境信息的特征向量结合后输入分类器,包括:
使用下述的sigmoid函数对该条对话文本的编码向量VQ3及其带有上下文相关的语境信息的特征向量VH进行结合,E=sigmoid(WE*[VQ3+SVH]),其中,WE为经验参数,将结合得到特征向量E输入分类器。
5.根据权利要求1-4任一所述的方法,其特征在于,还包括获得验证集中每个意图的得分的步骤,该步骤具体包括:
利用训练得到的多标签分类模型对验证集中的每一条对话文本进行测试,输出预测标签向量,并采用目标函数计算该预测标签向量和目标标签向量之间相似度的得分,从而得到验证集中每个意图的得分,该得分介于0到1之间。
6.根据权利要求5所述的方法,其特征在于,还包括确定验证集中每个意图的得分的最佳阈值的步骤,该步骤具体包括:
S1:设定一个初始阈值为threshold=0.01,选择验证集中的一个意图并计算该意图在整个验证集上的F1分数;
S2:判断阈值threshold是否在(0,1)之间,若是,则更新该意图阈值为:threshold=threshold+0.01,然后计算该意图的F1分数,并与上一个F1分数比较大小,记录最大的F1分数以及其对应的阈值;若否,则进入步骤S3;
S3:判断是否遍历完所有的意图,若没有则遍历下一个意图,返回步骤1,反之进入步骤S4;
S4:最终选择每个意图最高的F1分数对应的阈值作为该意图的得分的最佳阈值。
7.一种多意图识别方法,其特征在于,包括:
编码步骤:对当前对话文本进行向量编码,并计算当前对话文本的带有上下文相关的语境信息的特征向量;
控制步骤:判断是否需要引入上下文相关的语境信息;
分类步骤:若控制步骤判断为是,则将当前对话文本的编码向量及其带有上下文相关的语境信息的特征向量结合后输入多标签分类模型,对当前对话文本的意图进行分类识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市北科瑞声科技股份有限公司,未经深圳市北科瑞声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010951226.5/1.html,转载请声明来源钻瓜专利网。





