[发明专利]一种基于可信度向量的知识图谱表示学习方法在审
申请号: | 201811140337.7 | 申请日: | 2018-09-28 |
公开(公告)号: | CN109189945A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 熊盛武;毛晶晶;段鹏飞 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 可信度 向量 复杂关系 属性信息 知识表示 复杂度 推理 学习 | ||
本发明提出了一种基于可信度向量的知识图谱表示学习方法,在该方法中基于可信度向量,实体在不同关系下具有不同表达形式,不同的关系关注实体不同的属性信息,本发明能够提升知识表示学习在复杂关系下的区分能力,并且避免了增加过多模型复杂度。本发明方法可以对知识图谱中的实体和关系进行表示,用于知识图谱的补全和推理,具有较好的实用性。
技术领域
本发明涉及知识图谱表示学习问题,具体地指一种基于可信度向量的知识图谱表示学习方法,属于自然语言处理领域。
背景技术
近年来类人智能在世界各地迅猛发展,其成功离不开完善的知识图谱。知识图谱是智能问答、语义搜索等信息服务应用的重要基础技术,知识图谱覆盖的知识越全面,越能更好地提供所需答案。尽管目前已经有多个大规模、开放领域的知识图谱,但它们距离完备仍然相差甚远,例如Freebase中有大约30%的人物实体缺少其父母亲信息。通常情况下,人类都是以网络和图的架构来组织和表示知识图谱中所包含的知识,图和网络中的每一个节点都表示不同的实体,而每两个节点之间相连的边则表示两个实体之间存在的关系。因此,传统的知识图谱大多数都是采用<实体1,关系,实体2>三元组的方式来表示知识,其对应的是知识图谱中的两个节点以及连接这两个节点的边。在传统的网络表示形式下利用知识图谱进行推理、补全,需要设计专门的图算法,其计算效率极低。而利用知识表示学习模型,能在低维空间中挖掘出实体和关系之间的语义关系,提高知识理解和推理能力。
目前知识表示学习的代表模型是平移模型,该模型虽然简单高效,但平移模型无法很好地处理知识图谱中的复杂关系。这就是本发明的主要研究背景。
发明内容
本发明的目的在于克服上述现有技术的不足,而提出的一种知识图谱表示学习方法,该方法包括:
步骤1,输入知识图谱中的三元组(h,r,t),根据关系r生成其对应的可信度向量;
步骤2,根据可信度向量,定义三元组(h,r,t)中实体向量、关系向量和可信度向量之间的相互关联;
步骤3,通过损失函数将实体向量、关系向量和可信度向量关联起来,并最小化损失函数,以学习实体向量、关系向量和可信度向量,达到优化目标。
在上述的一种基于可信度向量的知识图谱表示学习方法,每一个三元组关系有一个对应的可信度向量,并对其中的向量值进行随机初始化,赋值0或1。
在上述的一种基于可信度向量的知识图谱表示学习方法,在可信度向量对应的空间中,关系r和实体对(h,t)之间存在平移关系,其相互关联的能量函数为:
其中,h、t和r为头实体h、尾实体t和关系r对应的向量;cr为关系的r可信度向量,其为一个二值向量,其中1代表激活,0代表抑制;hr为头实体h经过可信度向量激活后的向量;tr为尾实体t经过可信度向量激活后的向量;rr为关系r经过可信度向量激活后的关系;为哈达吗积。
在上述的一种基于可信度向量的知识图谱表示学习方法,通过损失函数将实体向量、关系向量和可信度向量关联起来,并最小化损失函数,以学习实体向量、关系向量和可信度向量;损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811140337.7/2.html,转载请声明来源钻瓜专利网。