本发明提供了一种基于知识图谱和神经网络的智能答疑方法,包括以下步骤:S1.形成用户问句q指向领域本体的候选概念集合;S2.形成用户问句指向领域本体排名前N的候选概念集合TOP(N),以及在问句q中相对应的概念提及集合M(N);S3.计算得出用户问句与候选概念的所有概念关系对的相似度;S4.将与用户问句q相似度值最大的概念关系对作为答案知识源;S5.在学科知识图谱的关系记录库中查询概念关系对,得到用户问句的答案并呈现给用户。本发明以学科知识图谱作为知识库,以学科知识图谱关系记录库中的关系记录作为问句的答案来源,同时通过卷积神经网络实现问句的处理与分类,提高了问句在概念关系对上的分类精度。
1.一种基于知识图谱和神经网络的智能答疑方法,其特征在于包括以下步骤:S1.使用用户问句q中的每个汉字,检索领域本体中包含该汉字的概念,形成用户问句q指向领域本体的候选概念集合ConSet;S2.通过候选概念集合ConSet及其与问句q基于字表面的相似度,自动识别用户问句q中的概念提及,形成用户问句q指向领域本体排名前N的候选概念集合TOP(N),以及在问句q中相对应的概念提及集合M(N);S3.从概念提及集合M(N)中选择一个概念提及m,逐一检索m在TOP(N)中对应候选概念c的每一个形如t(c,r)的概念关系对,通过基于字表面的问句q与候选概念c的相似度sim(q,c)、基于标准卷积神经网络的概念提及m与候选概念c之间的相似度sim(c,m)、基于多级蕴涵卷积神经网络的问句q与语义关系r的相似度sim(q,r),计算得出用户问句q与候选概念c的所有概念关系对的相似度;S4.重复步骤S3,直至集合M(N)中的每个概念提及被处理完毕,并将通过步骤S3得到的与用户问句q相似度值最大的概念关系对t(c’,r’)作为答案知识源;S5.在学科知识图谱的关系记录库中查询概念关系对t(c’,r’),得到用户问句q的答案并呈现给用户;其中,所述步骤S2包括如下子步骤:2.1计算ConSet中的每一个候选概念c与用户问句q的最长连续公共子序列LCCS(c,q):LCCS(c,q)=∪i≤|c|{s(i)∈c∩q|s(i)是s(i-1)在c中的后继}2.2通过最长连续公共子序列LCCS(c,q),计算在ConSet中的每一个候选概念c与用户问句q的基于字表面的相似度sim(q,c):保留相似度排名前N的候选概念,形成用户问句q在领域本体排名前N的候选概念集合TOP(N);2.3对于集合TOP(N)中的每一个候选概念c与用户问句q的最长连续公共子序列LCCS(c,q),按如下方法进行扩展,形成用户问句q的N个概念提及集合M(N):如果LCCS(c,q)与对应的候选概念c的长度相同,则c就是用户问句q的一个概念提及;如果c比其LCCS(c,q)更长并且在左边有L1个汉字,或c比LCCS(c,q)更长并且在右边有L2个汉字,则在问句q中逐字扩展LCCS(c,q)左侧L1个汉字或右侧L2个汉字,直到在问句q中出现c的左边界字或右边界字为止,此时扩展后的LCCS(c,q)就是c在q中对应的概念提及;所述用户问句q的一个概念提及是指q中可能包含的一个提问概念;所述步骤S3中,标准神经网络的处理过程包括:3.1.1使用标准卷积神经网络S_CNN的输入层来统一处理文本片段,形成文本片段的输入特征矩阵,所述文本片段包括概念提及、领域本体中的候选概念,以及关系成份中的概念类型、主题与媒体类型;3.1.2S_CNN通过卷积层从所述文本片段中提取n-grams特征,产生n-gram特征的语义向量;3.1.2将所有的n-gram特征的语义向量通过逐行最大池化输出所述文本片段的语义向量,包括领域本体中的候选概念、概念提及、概念类型、主题与媒体类型的语义向量vc、vm、vr1、vr2与vr3;所述步骤3.1.1包括:S_CNN的输入层将长度为s个汉字的输入序列x转换为维度为d×s的实数特征矩阵,其中d表示每个汉字随机初始化的实数嵌入向量的维数,且所述实数特征矩阵等价于s个维度为d的向量序列:v1,v2,…,vs;所述步骤3.1.2包括:S_CNN通过一个卷积层从滑动的n-gram中进行语义向量学习,对于长度为s个汉字的输入序列x:v1,v2,…,vs,令向量ci∈Rnd表示如下n个汉字嵌入向量的联接嵌入:vi-n+1,...,vi,其中n为卷积滑动过滤器filter的宽度,Rnd表示维度为n*d的实数向量集合,i为n-gram在输入序列x中的结束位置,且有0<i<s+n,以及对于i<1或i>s的嵌入向量vi使用零值填充;卷积层使用卷积权重W∈Rd×nd为n-gram的向量序列vi-n+1,...,vi产生一个n-gram特征的语义向量pi∈Rd,计算公式如下:pi=ta
本文链接:http://www.vipzhuanli.com/tech/sell/s_2271031.html,转载请声明来源钻瓜专利网。