[发明专利]基于文本分类预测的知识库维护方法及装置在审
| 申请号: | 201910830001.1 | 申请日: | 2019-09-04 |
| 公开(公告)号: | CN110532400A | 公开(公告)日: | 2019-12-03 |
| 发明(设计)人: | 李加庆;沈春泽;王景斌 | 申请(专利权)人: | 江苏苏宁银行股份有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 32368 南京瑞华腾知识产权代理事务所(普通合伙) | 代理人: | 梁金娟<国际申请>=<国际公布>=<进入 |
| 地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识库 知识点 客服 预测模型 分类 机器人 维护 文本相似度 知识库维护 动态监测 二次确认 分类模型 文本分类 用户体验 近实时 智能化 准确率 迭代 更新 算法 关联 答案 智能 预测 | ||
1.一种基于文本分类预测的知识库维护方法,其特征在于,包括如下步骤:
1)获取知识库管理前端界面用户输入的知识点问题文本;
2)将步骤1)中用户输入的知识点问题文本进行字符串处理和文本词向量表示;
3)调用预先训练好的知识点分类预测模型根据步骤2)的文本词向量表示进行分类预测以计算获取各类别的得分值,然后将得分值与类别标签组成二元组(类别,得分值)按照得分值从大到小顺序排序得到类别列表;
4)将步骤3)中类别列表发送至知识库管理前端界面,以便用户从类别列表中选取一类别,并接收由知识库管理前端界面发送的经由用户从类别列表中选取确认的一类别;
5)将知识库中所有在步骤4)类别下的标准问与用户输入的知识点问题进行相似度计算,将相似度较高的多个标准问作为用户输入知识点问题的参考标准问并发送至知识库管理系统前端界面,以便用户从中将相似度最高的标准问与输入知识点问题关联,或将输入知识点问题作为新的知识点问题并录入与问题对应的答案;接收由知识库管理系统前端界面发送的经由用户确认的输入知识点问题与标准问的关联信息,或将输入知识点问题作为新的知识点问题及对应的答案信息,并保存在知识库数据库中。
2.根据权利要求1所述的基于文本分类预测的知识库维护方法,其特征在于,所述步骤2)中将用户输入的知识点问题文本进行字符串处理包括字符纯化、文本纠错、业务术语归一化和分词处理。
3.根据权利要求1所述的基于文本分类预测的知识库维护方法,其特征在于,所述步骤3)中预先训练好的知识点分类预测模型具体包括如下步骤:
3a)将知识库的标准问以及对应的相似问,与对应的分类标签做成数据对,存为文本文件形式或迭代生成器对象形式;
3b)将步骤23a)中所有标准问及对应的相似问进行预处理,得到语料数据集;
3c)将步骤3b)语料数据集合划分训练集和测试集,对训练集中的知识点问题文本采用词向量表示,采用神经网络进行训练,对训练后的神经网络模型进行测试验证,构建出预测准确率满足阈值的知识点分类预测模型;
3d)对知识库底层数据库的变更做实时统计,当类别或某一类别对应知识点变更数量大于设定阈值时,则跳转至步骤2a)进行重新训练并更新。
4.根据权利要求3所述的基于文本分类预测的知识库维护方法,其特征在于,所述步骤3b)中预处理包括字符纯化、文本纠错、业务术语归一化和分词处理。
5.根据权利要求3所述的基于文本分类预测的知识库维护方法,其特征在于,所述步骤3c)中采用的神经网络为TextCNN或LSTM,词向量表示采用Word2Vec模型。
6.根据权利要求3所述的基于文本分类预测的知识库维护方法,其特征在于,所述步骤3d)具体包括:
对知识库底层数据库的知识点变更做实时统计,类别总数记为N,发生变更的类别数量记为M,类别i中发生变更的知识点的数量记为KNi,变更前的知识点总数为Ki,1≤i≤N。当M/N大于阈值A,或者存在一个i,KNi/Ki大于阈值B时,跳转至步骤2a)拉取知识库数据并进行模型更新训练步骤,对模型进行重新训练并更新。
7.根据权利要求1所述的基于文本分类预测的知识库维护方法,其特征在于,所述步骤5)中文本相似度计算通过下列公式获得:
其中x,y代表知识点文本,Vx和Vy代表文本的特征向量,tx和ty代表对应文本的分类标签One-hot向量表示,θ∈(0,1)为权重调节参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏苏宁银行股份有限公司,未经江苏苏宁银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910830001.1/1.html,转载请声明来源钻瓜专利网。





