[发明专利]一种基于剪枝子图的知识图谱表示方法在审
申请号: | 202210483527.9 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114780750A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 刘文杰;姚俊飞 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28;G06N3/08 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 陈天林 |
地址: | 210044 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 剪枝 知识 图谱 表示 方法 | ||
1.一种基于剪枝子图的知识图谱表示方法,其特征在于,包括以下步骤:
步骤一:采用TransE模型学习三元组(eh,r,et)的结构化信息,得到实体特征向量矩阵和关系特征向量矩阵
步骤二:所述知识图谱为有向图,信息由头实体传播到尾实体,通过计算三元组中的头实体特征向量和关系特征向量之间的距离得到关系传播系数,得到一个ne×ne邻接权重矩阵;
步骤三:所述知识图谱为有向图,尾实体聚合头实体的信息,所以对目标实体j(尾实体)的k阶实体由里向外呈线性扩展进行选择性采样,形成剪枝子图S(j);设定采样系数为β,一阶采样β个,二阶采样2β个,k阶采样kβ个;每采样一阶,则通过邻接权重矩阵来计算关系的采样概率P(v|u),通过关系来选择采样实体,从而形成目标实体的剪枝子图S(j);
步骤四:剪枝子图中实体的重要性随着阶数的增高而降低,通过折扣系数对剪枝子图中每一阶实体进行评估,形成剪枝子图特征向量
步骤五:将剪枝子图特征向量与GAT进行结合,每个实体通过聚合邻居剪枝子图特征向量得到新的特征向量
步骤六:将最初的实体特征向量经过线性变换,和相加得到最终实体特征向量同时对输入的关系特征向量进行线性变换得到新的关系特征矩阵向量
步骤七:将最终的实体特征向量矩阵以关系特征向量矩阵进行翻译模型优化训练。
2.根据权利要求1所述的一种基于剪枝子图的知识图谱表示方法,其特征在于,所述实体特征向量矩阵E的维度为(ne,d),其中ne表示实体的数量;所述关系特征向量矩阵R的维度为(nr,d),其中nr表示关系的数量,d表示特征向量的维度。
3.根据权利要求1所述的一种基于剪枝子图的知识图谱表示方法,其特征在于:所述步骤二具体计算公式为:
其中,表示头实体和尾实体之间关系的传播系数,根据头实体和关系之间的欧式距离求得传播系数,由此来求得邻接权重矩阵。
4.根据权利要求1所述的一种基于剪枝子图的知识图谱表示方法,其特征在于:所述步骤三中具体采样概率和形成的子图S(j)为:
S(j)={{ej},{e1,1,e1,2,...e1,β},...{ek,1,ek,2,...ek,kβ}}
其中,定义实体v是上一阶采样实体u的邻居,实体u的邻居实体集合为N(u),cv,u代表关系(v,u)的权重,N(u)/S(j)表示除去已经在剪枝子图中的实体,{ek,1,ek,2,...ek,kβ}表示剪枝子图中采样的每一阶实体集合;{ej}代表实体j。
5.根据权利要求1所述的一种基于剪枝子图的知识图谱表示方法,其特征在于:所述步骤四具体公式为:
其中,ρ是一个0到1之间的折扣系数,阶数越高,实体对于剪枝子图的重要性就越低,表示实体j的特征向量,表示采样的第k阶实体的特征向量相加,W1是线性变换矩阵,对打完折扣的每阶实体进行一次特征提取,是剪枝子图特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210483527.9/1.html,转载请声明来源钻瓜专利网。