[发明专利]一种基于多视角推理的弱监督知识图谱问答方法有效

专利信息
申请号: 202110935495.7 申请日: 2021-08-16
公开(公告)号: CN113590799B 公开(公告)日: 2022-11-18
发明(设计)人: 胡楠;漆桂林 申请(专利权)人: 东南大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/36;G06K9/62
代理公司: 南京众联专利代理有限公司 32206 代理人: 杜静静
地址: 210096 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 视角 推理 监督 知识 图谱 问答 方法
【说明书】:

发明公开了一种基于多视角推理的弱监督知识图谱问答方法,主要通过解决知识图谱问答在弱监督条件下的长路径推理和伪路径问题。首先利用自然语言问题中涉及的知识图谱实体获取知识图谱子图。然后,利用知识图谱表示学习算法将知识图谱三元组映射为向量表示,同时在预训练语言模型的基础上将问题和子图中的关系映射为向量表示。接着,计算问题的向量表示与关系向量表示的语义匹配度和问题向量表示在知识图谱三元组中的结构匹配度。最后,通过监督学习的方法先优化与问题语义相似的关系,再优化与问题语义最相近的关系,得到一种在弱监督条件下的知识图谱问答核心路径推理模型。

技术领域

本发明涉及一种基于多视角推理的弱监督知识图谱问答方法,属于自然语言处理技术领域。

背景技术

随着DBpedia、Freebase和WikiData等知识图谱的发展,它们的规模变得非常庞大。没有专业知识的普通人想要从大规模的知识图谱中查找知识是很困难的事情,于是人们越来越重视寻找有效便捷的方法来获取这些宝贵的知识资源。知识图谱问答又称知识库问答(KnowledgeBaseQuestionAnswering,KBQA),它以自然语言作为查询语言,是一种非常人性化的解决方案,使得它成为了近年来的研究热点。尽管有大量的研究,但KBQA仍然是具有挑战的任务,即使在研究得很好的领域,如英语中的开放领域KBQA,现有的方法也很难与人类对问题的理解相匹配。KBQA存在的挑战包括:1)表达差异,即自然语言问题的表达形式可能与KB中表达形式完全不同,导致自然语言问题到KB的映射变得困难;2)歧义,同一个词汇可能代表不同的实体,如“苹果”可能是水果,也可能是手机品牌。此外,由于训练数据的标注成本昂贵并且可能涉及专业知识来构造查询形式,尤其是在一些非英语的低资源语言上和一些专业的领域如法律或生物医学,它们给数据标注带来额外的成本。所以最近一些工作考虑在只给定问题和最终答案的这种弱监督情况下进行问答,因为只获取最终答案相比需要构造查询形式来说是更简单的。

KBQA中有两个关键的子任务,分别是实体链接(EntityLinking,EL)和路径推理(PathReasoning,PR)。EL的目的将自然语言问题链接到KB中的实体,它通常涉及两个步骤,主语检测和实体消歧。首先通过主语检测识别出自然语言问题中的主语提及,它近似于KB实体的名称,然后将主题提及链接到KB中获得候选主语实体,然后利用实体消歧方法对候选主语实体进行筛选。PR的目的是将自然语言问题映射到KB中的路径上,路径由一跳或者多跳关系组成。通过这条路径能够从KB中检索出问题的答案。

随着人工智能技术的发展,利用神经网络进行KBQA的方法也得到了发展并且展现出了光明的前景。一般来说,目前最流行的KBQA方法主要分为两类:基于语义分析和基于信息检索。基于语义分析的方法首先设计一个语义解析器将问题映射到逻辑形式,例如λ-DCS、可执行SPARQL或SQL查询、基于图结构的查询。然后利用一个执行模块来执行知识库中的查询。基于信息检索的方法首先标识主题实体,然后从知识图谱中检索距离主题实体一跳或多跳的子图作为候选答案,接下来设计各类特征将候选答案映射到低维的向量空间中,然后进行比较排序。

发明内容

本发明从现有KBQA工作在弱监督条件下,面对多跳的复杂问题难以正确理解问题语义进行推理的情况出发,依据多个角度的匹配约束,基于神经模型自身的迭代训练过程提出了一种基于多视角推理的弱监督知识图谱问答方法。该方法首先从文本语义匹配和知识图谱结构匹配两个角度逐步地对齐问题与路径,然后再利用两阶段优化方法,先优化与问题相似的路径再优化与问题最匹配的路径来训练模型。这样提出的路径推理模型能够更加准确地理解问题语义,推理出合理的通往答案的知识图谱路径而不是伪路径。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110935495.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top