[发明专利]一种基于多视角推理的弱监督知识图谱问答方法有效
申请号: | 202110935495.7 | 申请日: | 2021-08-16 |
公开(公告)号: | CN113590799B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 胡楠;漆桂林 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06K9/62 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视角 推理 监督 知识 图谱 问答 方法 | ||
1.一种基于多视角推理的弱监督知识图谱问答方法,其特征在于,该方法包含以下步骤:
步骤1)将自然语言问题链接到知识图谱中的实体,并通过实体查询知识图谱获取问题对应的子图;
步骤2)通过知识图谱表示学习算法TransE将知识图谱中的三元组映射到向量空间,学习每个实体和关系和向量表示;
步骤3)通过预训练模型BERT获取自然语言问题的句子向量表示和步骤1)中子图的每个关系向量表示;
步骤4)通过步骤3)中的句子向量表示获取部分语义向量;
步骤5)通过计算步骤4)给出的部分语义向量与步骤3)给出的关系向量的相似度得分,以及部分语义向量在步骤2)中学习到的知识图谱表示学习算法的得分;
步骤6)利用步骤5)给出的相似度得分和表示学习算法得分计算在步骤1)中子图里的每条推理路径的联合推理概率;
步骤7)在大量数据上,通过mini-batch梯度下降的方式来训练初始模型,利用核采样算法选择步骤6)给出的概率和大于阈值的推理路径集合来计算损失分数更新参数,获得经过第一阶段优化的核心路径推理模型;
步骤8)在大量数据上,通过mini-batch梯度下降的方式来训练通过步骤7)给出的模型,通过步骤6)的模型概率计算公式,计算得到步骤7)核采样路径中概率最大的路径,利用该路径来计算损失分数更新参数,获得第二阶段优化的核心路径推理模型。
2.根据权利要求1所述的基于多视角推理的弱监督知识图谱问答方法,其特征在于,步骤1)中将自然语言问题利用实体链接算法链接到知识图谱中的实体,然后利用实体在知识图谱中检索,获取T跳以内的子图。
3.根据权利要求1所述的基于多视角推理的弱监督知识图谱问答方法,其特征在于,步骤2)中,通过知识图谱表示学习算法TransE将知识图谱中的实体和关系映射到低维的向量空间中,获得每个实体和关系和向量表示,对于知识图谱中的正确三元组(h,l,t)和负采样的错误三元组(h’,l,t’),通过代价函数在每个mini-batch更新的实体h、t和关系l的向量:
d()表示距离计算函数。
4.根据权利要求1所述的基于多视角推理的弱监督知识图谱问答方法,其特征在于,步骤3)通过预训练模型BERT获取自然语言问题q的句子向量表示Eq和步骤1)中子图的每个关系r的向量表示Er,自然语言问题q和关系r都由多个单词组成,Eq和Er为单词向量之和取平均。
5.根据权利要求1所述的基于多视角推理的弱监督知识图谱问答方法,其特征在于,步骤4)对步骤3)中的句子向量表示Eq获取部分语义向量Ct,部分语义向量Ct表示第t步推理关注的问题语义信息,它由一个记忆单元决定,部分语义向量Ct的计算公式为:
其中Wz、Wr和W为随机初始化的权重矩阵,sigmoid和tanh为非线性激活函数。
6.根据权利要求1所述的基于多视角推理的弱监督知识图谱问答方法,其特征在于,步骤5)使用点积计算步骤4)给出的部分语义向量Ct与步骤3)给出的关系向量Er的相似度得分Sm:
;
以及部分语义向量Ct在步骤2)中学习到的知识图谱表示学习算法TransE里的三元组得分Sφ:
其中φ()表示TransE计算三元组的得分函数,Eei和Eej是三元组的头实体向量和尾实体向量,Vq是随机初始化的转换矩阵Mc和Ct的点积结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110935495.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模块化组装下侧门
- 下一篇:一种表面具有抗菌层的镁合金智能手机壳体