[发明专利]金融长对话文本主题分类方法、装置、设备及介质在审
申请号: | 202310639951.2 | 申请日: | 2023-05-31 |
公开(公告)号: | CN116628205A | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 张莉;张茜;任杰;姜敏华;于佳玉 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06N3/0442;G06F40/30;G06N3/08;G10L15/26 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 金融 对话 文本 主题 分类 方法 装置 设备 介质 | ||
1.一种金融长对话文本主题分类方法,其特征在于,所述方法包括:
对获取的金融长对话文本进行金融角色划分,得到客服对话以及用户对话;
对所述客服对话以及所述用户对话进行切分,得到第一金融输入集以及第二金融输入集;
分别对所述第一金融输入集以及所述第二金融输入集进行向量转换,得到第一金融特征向量以及第二金融特征向量;
对所述第一金融特征向量以及所述第二金融特征向量进行降维处理,得到低维向量;
对所述低维向量进行归一化分类,得到所述金融长对话文本的金融主题分类结果。
2.如权利要求1所述的金融长对话文本主题分类方法,其特征在于,所述对获取的金融长对话文本进行金融角色划分,得到客服对话以及用户对话,包括:
获取所述金融长对话文本对应的音频,对所述音频进行人声分离,得到第一音频及第二音频;
对所述第一音频及所述第二音频进行语音识别,得到第一长对话文本及第二长对话文本;
根据所述第一长对话文本及所述第二长对话文本的内容进行分析,得到客服对话以及用户对话。
3.如权利要求1所述的金融长对话文本主题分类方法,其特征在于,所述对所述客服对话以及所述用户对话进行切分,得到第一金融输入集以及第二金融输入集,包括:
利用预设的双向长短期记忆网络,对所述客服对话以及所述用户对话进行语义识别,得到第一文本语义以及第二文本语义;
根据预设的条件随机场的预测算法,对所述第一文本语义以及第二文本语义进行词性标注和序列标注,得到第一标注文本以及第二标注文本;
对所述第一标注文本以及所述第二标注文本进行文本段分割,得到第一文本段、第二文本段、第一文本段对应的第一时间始末节点以及第二文本段对应的第二时间始末节点;
根据所述第一时间始末节点以及所述第二时间始末节点对所述第一文本段以及所述第二文本段进行抽取,得到第一金融输入集以及第二金融输入集。
4.如权利要求1所述的金融长对话文本主题分类方法,其特征在于,所述分别对所述第一金融输入集以及所述第二金融输入集进行向量转换,得到第一金融特征向量以及第二金融特征向量,包括:
将所述第一金融输入集以及所述第二金融输入集分别输入到预设的Bert网络中进行特征提取,得到第一金融输出向量以及第二金融输出向量;
对所述第一金融输出向量以及所述第二金融输出向量分别进行卷积、池化处理,得到第一金融特征向量以及第二金融特征向量。
5.如权利要求4所述的金融长对话文本主题分类方法,其特征在于,所述对所述第一金融输出向量以及所述第二金融输出向量分别进行卷积、池化处理,得到第一金融特征向量以及第二金融特征向量,包括:
将所述第一金融输出向量以及所述第二金融输出向量分别划分为多个大小相同的第一金融向量块以及第二金融向量块;
将所述第一金融向量块以及所述第二金融向量块分别与预设的卷积核相乘,得到多个第一卷积值以及第二卷积值;
将所述第一卷积值以及所述第二卷积值分别进行叠加,得到第一特征值以及第二特征值;
根据所述第一特征值以及所述第二特征值建立池化缓存,对所述第一特征值以及所述第二特征值进行计算,得到第一金融特征向量以及第二金融特征向量。
6.如权利要求1所述的金融长对话文本主题分类方法,其特征在于,所述对所述第一金融特征向量以及所述第二金融特征向量进行降维处理,得到低维向量,包括:
获取所述第一金融特征向量以及所述第二金融特征向量的相对位置,通过预设的相对位置编码对所述相对位置进行编码,得到金融位置向量矩阵;
根据所述金融位置向量矩阵的相对位置,计算相对位置注意力权重以及金融位置向量矩阵的目标注意力权重;
对所述相对位置注意力权重与目标注意力权重进行拼接,得到拼接向量,利用所述拼接向量构建线性层;
利用所述线性层对所述拼接向量进行线性变换,得到低维向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310639951.2/1.html,转载请声明来源钻瓜专利网。