[发明专利]一种基于深度语义学习的智能客服实现方法及系统有效
申请号: | 202310838313.3 | 申请日: | 2023-07-10 |
公开(公告)号: | CN116561287B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 张步林;熊林海;刘亮 | 申请(专利权)人: | 南京大全电气研究院有限公司;大全集团有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06Q30/015;G06F16/33;G06F18/241 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 蔚湘莹 |
地址: | 211100 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 语义 学习 智能 客服 实现 方法 系统 | ||
1.一种基于深度语义学习的智能客服实现方法,其特征在于,包括:
构建问答对数据库,所述问答对数据库包含多组问答对数据,每组问答对数据中均包含问题和答案;
利用关键词提取技术对问答对数据库中,所有问答对数据的问题和答案进行关键词提取,获得问题关键词和答案关键词;
基于问答对数据库,采用深度算法学习模型建立标签分类器,包括:
按照以下方式建立初始的标签分类器:
针对每个问答对数据,均基于相似度算法计算问题关键词、答案关键词与预设分类标签的相似度,具体计算公式如下:
其中,simQ为问题关键词和预设分类标签的相似度值,simA为答案关键词和预设分类标签的相似度值,embQ和embA分别是问题关键词和答案关键词的bertSim词嵌入向量,embC是预设分类标签的bertSim词嵌入向量;
按照以下公式,获取每个问答对数据与每个分类标签的相似度值simC:
其中,和分别为预设的权重值;
针对每个问答对数据,均将对应最大simC的分类标签作为所述问答对数据的分类标签;
利用问答对数据库中的数据,设置训练集和测试集,其中,问题和问题关键词均作为训练数据;
基于训练集和测试集,采用Bert文本分类模型进行训练,在模型准确率超过预设阈值时停止训练,得到标签分类器,所述标签分类器能够确定问题和答案的分类标签;
根据用户输入的检索问题,判断是否触发转人工客服的条件,
如果是,将用户转接入人工客服;
如果否,提取检索问题中的关键词,并且,利用标签分类器确定检索问题的分类标签;
根据检索问题的关键词和分类标签,判断问答对数据库中是否存在最佳答案,
如果是,向用户输出最佳答案;
如果否,将检索问题输入预设的深度算法问答工具中获取对应的答案,并将检索问题和对应的答案发送至人工客服;
判断是否接收到人工客服发送的转接信息,
如果是,将用户转接入人工客服。
2.根据权利要求1所述的方法,其特征在于,所述根据用户输入的检索问题,判断是否触发转人工客服的条件,包括:
利用错别词校验器对检索问题进行校验;
采用LAC分词器对校验后的检索问题进行分词,并去除停用词;
对剩余的分词进行组合,获得检索问题对应的文本数据;
判断所述文本数据中包含的汉字数量是否不超过10,且文本数据中包含预设的转人工关键词,
如果是,确认触发转人工客服条件。
3.根据权利要求2所述的方法,其特征在于,所述提取检索问题中的关键词,并且,利用标签分类器确定检索问题的分类标签,包括:
使用预设的深度算法问答工具对检索问题的文本数据进行关键词提取,获取检索关键词列表;
根据文本数据和检索关键词列表,基于标签分类器获取检索问题的分类标签。
4.根据权利要求3所述的方法,其特征在于,所述根据检索问题的关键词和分类标签,判断问答对数据库中是否存在最佳答案,包括:
利用标签分类器确定问答对数据库中,每一组问答对数据对应的分类标签;
根据问题、问题关键词和分类标签,利用ES检索,计算在问答对数据库中,与检索问题具有相同分类标签的问答对数据与检索问题之间的相似度得分;
选取相似度得分最高的前预设数量组问答对数据作为相似问答对;
判断是否存在相似度得分超过预设阈值的相似问答对,
如果是,将相似度得分最高的一组相似问答对中的答案作为最佳答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大全电气研究院有限公司;大全集团有限公司,未经南京大全电气研究院有限公司;大全集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310838313.3/1.html,转载请声明来源钻瓜专利网。