[发明专利]一种知识库的补全方法及补全装置在审
申请号: | 201810085005.7 | 申请日: | 2018-01-29 |
公开(公告)号: | CN108304933A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 王志春;黄勇 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体属性 知识库 关系路径 特征向量 归一化 三元组 预测 分类器训练 获取目标 实体关系 特征结合 集合 | ||
本发明提供了一种知识库的补全方法及补全装置。方法包括:获取目标关系对应实体对集合中实体对的关系路径特征和关系路径特征向量;获取实体对中头实体对应的实体属性特征值和尾实体对应的实体属性特征值以及头实体的归一化实体属性特征值、尾实体的归一化实体属性特征值和归一化实体属性特征值的差值;头实体和尾实体的归一化实体属性特征值和差值形成实体属性特征向量;将关系路径特征向量和实体属性特征向量输入至分类器训练模型中,获取三元组的补全预测值;将补全预测值大于0.5的三元组确定为知识库的补全三元组。本发明通过将关系路径特征和实体属性特征结合并对知识库中实体关系进行预测,实现补全了知识库并提高了补全结果的准确性。
技术领域
本发明涉及知识库补全技术领域,具体涉及一种知识库的补全方法及补全装置。
背景技术
大规模的知识库一般通过自动构建技术建立,包含大量的实体、关系和属性值。知识库使用三元组的形式对现实世界中实体的各种知识进行表示,三元组包括关系型和属性型两大类。关系型三元组形如<XX大学,位于,XX市>,其中“XX大学”和“XX市”分别表示关系型三元组的头实体和尾实体,“位于”表示关系型三元组中头实体和尾实体之间的关系;属性型三元组形如<XX大学,建校于,XX年>,其中“XX大学”是头实体,“建校于”是实体属性特征,“XX年”是具体的实体属性特征值。虽然知识库的规模很大,但知识库仍然是不完备的,需要对现有的知识库进行补全。
知识库的补全包括两种方法:基于符号逻辑的方法和基于表示学习的方法。基于符号逻辑的方法主要包括AMIE和PRA等;其中,AMIE方法通过从知识库中挖掘关联规则进行知识库补全,PRA方法基于连接实体的关系路径特征来预测实体之间的关系。基于表示学习的方法是通过学习实体和关系的低维度向量,用向量的相似度计算预测实体之间的关系,常见表示学习的方法有TransE、TransH、TransR等。两类知识库补全的方法都只利用了关系型三元组进行知识库补全,知识库中大量存在的属性型三元组并未得到有效利用,因此降低了知识库扩充的准确性。
发明内容
针对现有技术中的缺陷,本发明提供一种知识库的补全方法及补全装置,实现获得更加精确的知识库补全结果。
为实现上述目的,本发明提供以下技术方案:
一方面,本发明提供了一种知识库的补全方法,包括:
确定知识库中的目标关系以及所述目标关系对应的实体对集合;
获取所述实体对集合中每个实体对的关系路径特征,多个所述关系路径特征形成关系路径特征向量;
在所述知识库中获取所述每个实体对中头实体所对应的实体属性特征值和尾实体所对应的实体属性特征值;
对所述头实体对应的实体属性特征值和所述尾实体对应的实体属性特征值分别进行归一化处理,获取所述头实体的归一化实体属性特征值、所述尾实体的归一化实体属性特征值以及归一化实体属性特征值的差值;
其中,所述归一化实体属性特征值的差值为:所述头实体的实体属性特征值与所述尾实体的实体属性特征值之间的差值;
根据所述头实体的归一化实体属性特征值、所述尾实体的归一化实体属性特征值以及归一化实体属性特征值的差值形成实体属性特征向量;
将所述关系路径特征向量和所述实体属性特征向量作为输入特征矩阵,输入至分类器训练模型中,获取基于所述关系路径特征向量和所述实体属性特征向量形成的三元组的补全预测值;
将所述补全预测值大于0.5的所述三元组确定为所述知识库的补全三元组。
进一步的,获取所述实体对集合中每个实体对的关系路径特征,多个所述关系路径特征形成关系路径特征向量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810085005.7/2.html,转载请声明来源钻瓜专利网。