[发明专利]一种知识库的补全方法及补全装置在审
申请号: | 201810085005.7 | 申请日: | 2018-01-29 |
公开(公告)号: | CN108304933A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 王志春;黄勇 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体属性 知识库 关系路径 特征向量 归一化 三元组 预测 分类器训练 获取目标 实体关系 特征结合 集合 | ||
1.一种知识库的补全方法,其特征在于,包括:
确定知识库中的目标关系以及所述目标关系对应的实体对集合;
获取所述实体对集合中每个实体对的关系路径特征,多个所述关系路径特征形成关系路径特征向量;
在所述知识库中获取所述每个实体对中头实体所对应的实体属性特征值和尾实体所对应的实体属性特征值;
对所述头实体对应的实体属性特征值和所述尾实体对应的实体属性特征值分别进行归一化处理,获取所述头实体的归一化实体属性特征值、所述尾实体的归一化实体属性特征值以及归一化实体属性特征值的差值;
其中,所述归一化实体属性特征值的差值为:所述头实体的实体属性特征值与所述尾实体的实体属性特征值之间的差值进行归一化;
根据所述头实体的归一化实体属性特征值、所述尾实体的归一化实体属性特征值以及归一化实体属性特征值的差值形成实体属性特征向量;
将所述关系路径特征向量和所述实体属性特征向量作为输入特征矩阵,输入至分类器训练模型中,获取基于所述关系路径特征向量和所述实体属性特征向量形成的三元组的补全预测值;
将所述补全预测值大于0.5的所述三元组确定为所述知识库的补全三元组。
2.根据权利要求1所述的补全方法,其特征在于,获取所述实体对集合中每个实体对的关系路径特征,多个所述关系路径特征形成关系路径特征向量,包括:
采用随机游走法抽取所述实体对集合中每个实体对的关系路径特征。
3.根据权利要求2所述的补全方法,其特征在于,所述关系路径特征的长度在2到6个关系路径之间。
4.根据权利要求1所述的补全方法,其特征在于,在所述知识库中获取所述每个实体对中头实体所对应的实体属性特征值和尾实体所对应的实体属性特征值,包括:
所述头实体不存在对应的实体属性特征值,则将头实体对应的实体属性特征值设置为零;
所述尾实体不存在对应的实体属性特征值,则将尾实体对应的实体属性特征值设置为零。
5.根据权利要求1所述的补全方法,其特征在于,基于知识库中三元组样本,采用逻辑回归算法对所述分类器训练模型进行训练,获取所述分类器训练模型的权重。
6.根据权利要求5所述的补全方法,其特征在于,所述分类器训练模型的逻辑回归函数为:
其中,f(v,w)为三元组的补全预测值,v为基于关系路径特征向量和实体属性特征向量形成的向量[Vr Vl],w为分类器训练模型的权重,Vr为关系路径特征向量,Vl为实体属性特征向量。
7.一种知识库的补全装置,其特征在于,包括:
输入单元,用于确定知识库中的目标关系以及所述目标关系对应的实体对集合;
第一参数单元,用于获取所述实体对集合中每个实体对的关系路径特征,多个所述关系路径特征形成关系路径特征向量;
获取单元,用于在所述知识库中获取所述每个实体对中头实体所对应的实体属性特征值和尾实体所对应的实体属性特征值;
处理单元,用于对所述头实体对应的实体属性特征值和所述尾实体对应的实体属性特征值分别进行归一化处理,获取所述头实体的归一化实体属性特征值、所述尾实体的归一化实体属性特征值以及归一化实体属性特征值的差值;
其中,所述归一化实体属性特征值的差值为:所述头实体的实体属性特征值与所述尾实体的实体属性特征值之间的差值;
第二参数单元,用于所述头实体的归一化实体属性特征值、所述尾实体的归一化实体属性特征值以及归一化实体属性特征值的差值形成实体属性特征向量;
预测单元,用于将所述关系路径特征向量和所述实体属性特征向量作为输入特征矩阵,输入至分类器训练模型中,获取基于所述关系路径特征向量和所述实体属性特征向量形成的三元组的补全预测值;
补全单元,用于将所述补全预测值大于0.5的所述三元组确定为所述知识库的补全三元组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810085005.7/1.html,转载请声明来源钻瓜专利网。