[发明专利]一种客诉识别模型的构建方法、客诉识别方法及装置在审
| 申请号: | 202310326933.9 | 申请日: | 2023-03-29 |
| 公开(公告)号: | CN116383698A | 公开(公告)日: | 2023-07-04 |
| 发明(设计)人: | 陈春荣;罗晋 | 申请(专利权)人: | 中国工商银行股份有限公司 |
| 主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/214;G06N3/08;G06N3/0442 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 贾磊;党晓林 |
| 地址: | 100140 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 识别 模型 构建 方法 装置 | ||
1.一种客诉识别模型的构建方法,其特征在于,所述方法包括:
将预先标注的客诉样本集和非客诉样本集经过层归一化处理,得到训练数据集;
将所述训练数据集输入到双层双向LSTM网络进行训练,得到所述训练数据集中每个样本的输出;
将所述训练数据集中每个样本最后一个字符的隐藏层输出组成第一向量;
对所述训练数据集全部样本的输出在列维度上分别进行最大池化操作和平均池化操作,得到第二向量和第三向量;
对所述第一向量、第二向量和第三向量输入到全连接层进行训练;
在所述全连接层的输出结果与所述训练数据集中的标注情况之间的匹配度满足要求的情况下,得到客诉识别模型。
2.根据权利要求1所述的方法,其特征在于,将所述训练数据集输入到双层双向LSTM网络进行训练之前,所述方法还包括:对所述训练数据集进行数据清洗。
3.根据权利要求2所述的方法,其特征在于,所述数据清洗包括:
对超过所述双层双向LSTM网络输入的最大文本长度的样本进行截断处理,以便于对截断处理后的所述训练数据集输入到双层双向LSTM网络进行训练。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对文本长度小于所述最大文本长度的样本,按照所述最大文本长度对所述样本的内容进行填充;
对填充的内容进行屏蔽处理,以便于将屏蔽处理后的所述训练数据集输入到双层双向LSTM网络进行训练。
5.根据权利要求4所述的方法,其特征在于,按照所述最大文本长度对所述样本的内容进行填充进一步包括:
在所述样本的内容最后连续填充多个预定字符,直至填充预定字符后的样本的文本长度等于所述最大文本长度。
6.根据权利要求4所述的方法,其特征在于,对填充的内容进行屏蔽处理进一步包括:
对填充的内容进行标记,以便于在双层双向LSTM神经网络的训练过程中,根据所述标记确定不参加计算的所述填充的内容。
7.根据权利要求2所述的方法,其特征在于,所述数据清洗还包括:
对所述训练数据集进行脱敏处理,以便于对脱敏处理后的所述训练数据集输入到双层双向LSTM网络进行训练。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
每对所述训练数据集中的全部样本进行一次训练后,根据所述全连接层的输出结果和所述训练数据集中的标注情况计算客诉识别模型正确率;
在所述正确率超过预设门限值且大于前后预定次训练对应的正确率时,将该正确率对应的所述客诉识别模型作为最终的客诉识别模型。
9.根据权利要求1所述的方法,其特征在于,计算所述全连接层的输出结果与所述标注情况之间的匹配度进一步包括:
对所述全连接层的输出结果进行argmax操作,得到所述训练数据集的样本分类情况;
计算所述样本分类情况和所述标注情况之间的匹配度。
10.一种客诉识别方法,其特征在于,所述方法包括:
获取用户反馈的文本数据;
将所述文本数据输入到预先利用权利要求1-9任意一项得到的客诉识别模型中进行计算,得到所述文本数据对应的客诉识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310326933.9/1.html,转载请声明来源钻瓜专利网。





