[发明专利]一种复杂网络下基于路径选择的表示学习方法在审

专利信息
申请号: 201810476981.5 申请日: 2018-05-18
公开(公告)号: CN108664652A 公开(公告)日: 2018-10-16
发明(设计)人: 刘琼昕;龙航;覃明帅;黄河燕 申请(专利权)人: 北京理工大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京理工正阳知识产权代理事务所(普通合伙) 11639 代理人: 王民盛
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种复杂网络下基于路径选择的表示学习方法,属于自然语言处理以及知识图谱技术领域。本发明通过在知识图谱上进行规定起始点的随机游走,得到实体间的路径信息,通过训练一个分类器来对高置信度的路径进行筛选。然后利用知识表示的方法将实体,关系和路径用低维向量方式进行表示。通过向量间的运算判断实体之间的关系。本发明提出的方法解决了传统路径推理中路径冗余导致的推理效率低下,是一种可以充分利用路径信息到表示学习中的结合方式。
搜索关键词: 复杂网络 路径信息 路径选择 推理 图谱 自然语言处理 传统路径 高置信度 结合方式 路径冗余 随机游走 向量方式 运算判断 知识表示 分类器 起始点 低维 向量 学习 筛选
【主权项】:
1.一种复杂网络下基于路径选择的表示学习方法,其特征在于:通过在知识图谱上进行规定起始点的随机游走,得到实体间的路径信息,这些路径信息存在大量的冗余数据,通过训练一个分类器来对高置信度的路径进行筛选;然后利用知识表示的方法将实体,关系和路径用低维向量方式进行表示,再通过向量间的运算判断实体之间的关系;所用符号定义和描述如下:知识图谱,记为T=<E,R,S>;其中,E表示实体集合,R代表关系集合,任意三元组,记为:(h,r,t),是集合S中的元素;其中,h为三元组(h,r,t)的头,t为三元组(h,r,t)的尾,且h,t∈E,关系r∈R;任意关系r对应的路径特征集合,记为Πr=(p1;...;pd),;其中,Πr是所有存在关系r的实体对间路径集合的并集,Πr中的路径p1;...;pd对应的权值为路径置信度,记为w=(w1,...,wd);在某种程度上路径特征可以视作是推理关系r的证据和现象,将路径特征主要分为三种类型:强证据Sr(p),弱证据Wr(p)以及伴随现象Cr(p),Πr=Sr(p)∪Wr(p)∪Cr(p),d=k+m+o.;通过以下步骤实现:步骤一、关键路径选择,包括对关键路径进行筛选以及计算对应路径置信度,具体包括如下子步骤:步骤1.1、路径特征抽取;步骤1.2、采用二值化的特征空间计算特征值;步骤1.3、使用线性模型和非线性模型分别计算路径的置信度,得到两套路径的置信度向量;步骤二、表示学习,具体通过构造负例、优化目标函数得到关系和实体的向量;具体使用TransE的实体和关系向量化方法以及TransE的目标函数,保证头、尾和关系之间的联系;在此基础上使用路径信息进一步对模型进行优化;步骤二又包括如下子步骤:步骤2.1、构造负例,以等概率随机替换三元组的头、尾及关系得到不出现在数据集中的三元组数据集合;具体基于知识图谱的封闭世界假设,封闭世界假设认为知识图谱中的事实都是正确的,而不出现在图谱中的事实都认为是错误的;所以利用知识库中的三元组(h,r,t)构造负例,以等概率随机替换三元组的头h,尾t,关系r得到不出现在数据集中的三元组数据集合:S‑={(h',r,t)}∪{(h,r',t)}∪{(h,r,t')};步骤2.2、构造由两部分组成的目标函数,目标函数包括关系三元组损失函数和路径三元组损失函数两部分;其中,关系三元组损失函数:对于一个三元组(h,r,t),损失函数的定义如下:E(h,r,t)=||h+r‑t||,ξ是预设大于0的正数来约束||h+r‑t||≤ξ,来确保r≈t‑h;路径三元组损失函数:对于长度为l的路径p=(r1,...,rl)路径向量由关系路径中的关系向量的相加得到,表示为:p=r1+...+rl;对于一个路径三元组(h,p,t)来说,损失函数定义如下:E(h,p,t)=||p‑(t‑h)||=||p‑r||=E(r,p),路径p作为推理关系r的有效规则之一,需要保证能量函数E(r,p)可以得到尽可能低的分数;确定模型目标函数(1)如下:等式右边L(h,r,t)是对实体关系的约束,L(p,r)是路径关系约束,R(p,r)是上文通过路径特征选取算法得到的路径p对于推理出关系r的置信度,是路径置信度w中的非零项,P(h,t)是实体对之间所有路径的集合;等式右边最后一项是目标函数的正则化项,λ是正则化项的超参数,Θ={h,t∈E}∪{r∈R};其中,目标函数(1)中的L(h,r,t)和L(p,r)具体使用hinge损失函数的形式计算,得到(2)和(3)的目标函数表示如下:步骤2.3、基于批量梯度下降法优化目标函数:采用批量梯度下降的方式对目标函数(1)中的L(S)进行最小化,迭代更新参数Θ={h,t∈E}∪{r∈R},最终得到关系和实体的向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810476981.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top