[发明专利]客服对话意图分类方法及装置、电子设备及介质在审
申请号: | 201910979317.7 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110888968A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 王振众;陈勇达;张伟;龚小龙;陈曦;麻志毅 | 申请(专利权)人: | 浙江省北大信息技术高等研究院;杭州未名信科科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/284 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 311200 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客服 对话 意图 分类 方法 装置 电子设备 介质 | ||
1.一种客服对话意图分类方法,其特征在于,包括:
获取第一训练样本集,其中,所述第一训练样本集包括第一数量的第一客服对话样本数据,所述第一客服对话样本数据具有人工标注的意图类别标识;
基于所述第一训练样本集,采用文本数据增强技术进行样本量扩充,得到第二训练样本集,其中,所述第二训练样本集包括第二数量的具有意图类别标识的第二客服对话样本数据,所述第二数量大于所述第一数量;
根据所述第二训练样本集训练文本分类模型,得到训练后的文本分类模型;
采用训练后的所述文本分类模型对待分类的客服对话数据进行分类,得到所述客服对话数据对应的意图类别标识。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一训练样本集,采用文本数据增强技术进行样本量扩充,得到第二训练样本集,包括:
针对所述第一训练样本集中的每条第一客服对话样本数据,提取对话意图段落;
根据提取的所述对话意图段落和所述第一客服对话样本数据的意图类别标识,生成第三客服对话样本数据;
将所有所述第三客服对话样本数据的集合,确定为第三训练样本集;
针对所述第三训练样本集,采用文本数据增强技术进行样本量扩充,得到第二训练样本集。
3.根据权利要求2所述的方法,其特征在于,所述针对所述第一训练样本集中的每条第一客服对话样本数据,提取对话意图段落,包括:
针对所述第一训练样本集中的每条第一客服对话样本数据,采用正则化技术匹配出客服问候语;
将所述客服问候语之后的指定数量句对话提取为对话意图段落。
4.根据权利要求2所述的方法,其特征在于,所述针对所述第三训练样本集,采用文本数据增强技术进行样本量扩充,得到第二训练样本集,包括:
针对所述第三训练样本集中的每条第三客服对话样本数据,执行同义词替换、同义词插入、词语位置变换和词语删除中的至少一项处理,得到与所述第三客服对话样本数据对应的多条第二客服对话样本数据;
将所有所述第二客服对话样本数据的集合,确定为第二训练样本集。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述第二训练样本集训练文本分类模型,得到训练后的文本分类模型,包括:
针对所述第二训练样本集中的每条所述第二客服对话样本数据,进行分词处理,生成训练语料;
将所述训练语料转换为词向量;
利用所述词向量训练文本分类模型,得到训练后的文本分类模型。
6.根据权利要求5所述的方法,其特征在于,所述针对所述第二训练样本集中的每条所述第二客服对话样本数据,进行分词处理,生成训练语料,包括:
针对所述第二训练样本集中的每条所述第二客服对话样本数据,进行分词处理,得到多条词语;
根据预设的过滤规则对所述多条词语进行过滤后,得到训练语料。
7.根据权利要求1所述的方法,其特征在于,所述文本分类模型包括层次注意力模型。
8.一种客服对话意图分类装置,其特征在于,包括:
第一训练样本集获取模块,用于获取第一训练样本集,其中,所述第一训练样本集包括第一数量的第一客服对话样本数据,所述第一客服对话样本数据具有人工标注的意图类别标识;
样本量扩充模块,用于基于所述第一训练样本集,采用文本数据增强技术进行样本量扩充,得到第二训练样本集,其中,所述第二训练样本集包括第二数量的具有意图类别标识的第二客服对话样本数据,所述第二数量大于所述第一数量;
模型训练模块,用于根据所述第二训练样本集训练文本分类模型,得到训练后的文本分类模型;
意图分类模块,用于采用训练后的所述文本分类模型对待分类的客服对话数据进行分类,得到所述客服对话数据对应的意图类别标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江省北大信息技术高等研究院;杭州未名信科科技有限公司,未经浙江省北大信息技术高等研究院;杭州未名信科科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910979317.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三维空间的仿真建模方法及装置
- 下一篇:一种单壁波纹管卷绕装置