[发明专利]基于文本分类预测的知识库维护方法及装置在审
| 申请号: | 201910830001.1 | 申请日: | 2019-09-04 |
| 公开(公告)号: | CN110532400A | 公开(公告)日: | 2019-12-03 |
| 发明(设计)人: | 李加庆;沈春泽;王景斌 | 申请(专利权)人: | 江苏苏宁银行股份有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 32368 南京瑞华腾知识产权代理事务所(普通合伙) | 代理人: | 梁金娟<国际申请>=<国际公布>=<进入 |
| 地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识库 知识点 客服 预测模型 分类 机器人 维护 文本相似度 知识库维护 动态监测 二次确认 分类模型 文本分类 用户体验 近实时 智能化 准确率 迭代 更新 算法 关联 答案 智能 预测 | ||
本发明公开了一种基于文本分类预测的知识库维护方法及装置。该方法先通过知识库分类语料来训练出知识点分类预测模型,然后基于知识点分类预测模型进行知识库的维护,并通过文本相似度算法召回与知识点相近的标准问,提供二次确认和答案关联。将人工维护知识库的过程智能化,辅助客服业务人员准确地进行知识点的更新维护,提高知识库的维护效率和质量。并且通过实时对知识库的动态监测,实现分类模型的近实时训练更新,对模型进行持续迭代,提高整个客服机器人的召回率和准确率,提升智能客服机器人的整体用户体验。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于文本分类预测的知识库维护方法及装置。
背景技术
目前智能客服机器人在各行各业均有比较广泛的应用,根据用户的询问,在知识库中寻找相关的问题及答案。知识库的质量在很大程度上决定了智能机器人的效果,也决定了客服的用户体验。
知识库维护系统是智能客服系统中的一个重要部分,常规做法是依赖客服业务人员对知识库系统中的数据进行维护,为了提高知识库检索的效果和准确率,客服业务人员需要对知识库数据进行准确的分类,并尽可能的增加标准问的相似问变种,以提高智能客服对用户询问的意图识别能力。通常一个垂直领域的知识库中会包含多个业务场景的分类,每个类别下面会包含多个业务问题的标准问,为了更准确的让用户理解问题,一般一个标准问会对应数个相似问,以覆盖同一个标准问不同的问题形式。这样的“类别——知识点标准问——相似问——知识点答案”的层次结构组成了知识库的逻辑结构。客服业务人员对于知识库的维护按照这样的逻辑结构结合业务场景及知识点的更新进行数据维护。
知识库的维护一般包含增加新的知识点标准问、更新已有的知识点、增加知识点相似问等操作。特别是增加新的知识点标准问和补充知识点标准问的相似问两种情况需要业务人员对其进行类别指定,相近知识点属于同一个类别,这对于问题的召回很有必要,知识点类别指定需要保持一致性。
然而在实际维护知识库的过程中,业务人员对于新增知识点或者新增相似问所属类别有时把握并不是很准,在知识库已有的知识点中去寻找相同的知识点或者相近的知识点来人为判断新的知识点的类别并不是很方便,特别是不同客服业务人员维护同一个知识库时容易出现意见不一致从而导致分类模糊混乱的情况,进而对知识点答案的准确召回产生影响,影响客服机器人的体验效果。
有鉴于此,研发设计出一种能解决上述问题的知识库维护方法。
发明内容
本发明的目的旨在解决上述问题,从而提供一种基于文本分类预测的知识库维护方法及装置。
为实现上述目的,在第一方面,本发明提供了一种基于文本分类预测的知识库维护方法,该方法包括如下步骤:
1)获取知识库管理前端界面用户输入的知识点问题文本;
2)将步骤1)中用户输入的知识点问题文本进行字符串处理和文本词向量表示;
3)调用预先训练好的知识点分类预测模型根据步骤2)的文本词向量表示进行分类预测以计算获取各类别的得分值,然后将得分值与类别标签组成二元组(类别,得分值)按照得分值从大到小顺序排序得到类别列表;
4)将步骤3)中类别列表发送至知识库管理前端界面,以便用户从类别列表中选取一类别,并接收由知识库管理前端界面发送的经由用户从类别列表中选取确认的一类别;
5)将知识库中所有在步骤4)类别下的标准问与用户输入的知识点问题进行相似度计算,将相似度较高的多个标准问作为用户输入知识点问题的参考标准问并发送至知识库管理前端界面,以便用户从中将相似度最高的标准问与输入知识点问题关联,或将输入知识点问题作为新的知识点问题并录入与问题对应的答案;接收由知识库管理系统前端界面发送的经由用户确认的输入知识点问题与标准问的关联信息,或将输入知识点问题作为新的知识点问题及对应的答案信息,并保存在知识库数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏苏宁银行股份有限公司,未经江苏苏宁银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910830001.1/2.html,转载请声明来源钻瓜专利网。





