[发明专利]用于知识图谱的数据预处理方法及装置在审

专利信息
申请号: 202010089110.5 申请日: 2020-02-12
公开(公告)号: CN111309823A 公开(公告)日: 2020-06-19
发明(设计)人: 巢林林;何建杉;王太峰;褚崴 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06F16/36;G06N3/02
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁;周良玉
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 知识 图谱 数据 预处理 方法 装置
【权利要求书】:

1.一种用于知识图谱的数据预处理方法,所述知识图谱包括对应于M个实体的M个节点,以及N个连接关系类别,并通过对应于N个连接关系类别的有向连接边描述M个节点之间的关联关系,M个节点分别对应M个s维的节点向量,N个连接关系类别分别对应N个s维的关系向量,所述方法包括:

根据所述知识图谱获取当前三元组,其中,所述当前三元组包括第一节点、第二节点以及第一连接关系类别,所述第一节点对应第一节点向量,所述第一连接关系类别对应第一关系向量,所述第二节点对应第二节点向量;

确定所述第一节点向量与所述第一关系向量通过哈达玛积融合得到的中间向量,与所述第二节点向量的距离;

基于所述距离,更新相应的节点向量及关系向量,从而得到用于表征知识图谱中的各个节点及各个连接关系类别的向量表示,使得所述知识图谱用于进行对应于所述M个节点的实体关系业务处理。

2.根据权利要求1所述的方法,其中,所述第一节点向量、所述第二节点向量、所述第一关系向量分别对应的初始向量,通过随机赋值确定,或者预先设定。

3.根据权利要求1或2所述的方法,其中,所述第一关系向量在各个维度上的初始值均在-1到1之间。

4.根据权利要求1所述的方法,其中,所述确定所述第一节点向量与所述第一关系向量通过哈达玛积融合得到的中间向量,与所述第二节点向量的距离包括:

确定所述中间向量与所述第二节点向量的差向量;

将所述差向量在各个维度上的数值的绝对值之和或者所述差向量的模确定为所述距离。

5.根据权利要求1所述的方法,其中,所述当前三元组为从所述知识图谱获取的正例三元组;所述基于所述距离,更新相应的节点向量及关系向量包括:

以最小化所述距离为目标,更新相应的节点向量及关系向量。

6.根据权利要求1所述的方法,所述当前三元组为对从所述知识图谱获取的正例三元组进行以下中的一项操作得到的负例三元组:用正例三元组的首节点以外的其他节点替换所述首节点作为第一节点;用正例三元组的尾节点以外的其他节点替换所述尾节点作为第二节点;

所述基于所述距离,更新相应的节点向量及关系向量包括:

以最大化所述距离为目标,更新相应的节点向量及关系向量。

7.根据权利要求1所述的方法,其中,所述方法还包括:

基于所述距离确定所述第一节点通过所述第一连接关系类别连接到所述第二节点的概率,所述概率与所述距离负相关;

在所述当前三元组为正例三元组的情况下,所述基于所述距离,更新相应的节点向量及关系向量包括:

以最大化所述概率为目标,更新相应的节点向量及关系向量;

在所述当前三元组为负例三元组的情况下,所述基于所述距离,更新相应的节点向量及关系向量包括:

以最小化所述概率为目标,更新相应的节点向量及关系向量。

8.一种用于知识图谱的数据预处理装置,所述知识图谱包括对应于M个实体的M个节点,以及N个连接关系类别,并通过对应于N个连接关系类别的有向连接边描述M个节点之间的关联关系,M个节点分别对应M个s维的节点向量,N个连接关系类别分别对应N个s维的关系向量,所述装置包括:

获取单元,配置为根据所述知识图谱获取当前三元组,其中,所述当前三元组包括第一节点、第二节点以及第一连接关系类别,所述第一节点对应第一节点向量,所述第一连接关系类别对应第一关系向量,所述第二节点对应第二节点向量;

确定单元,配置为确定所述第一节点向量与所述第一关系向量通过哈达玛积融合得到的中间向量,与所述第二节点向量的距离;

更新单元,配置为基于所述距离,更新相应的节点向量及关系向量,从而得到用于表征知识图谱中的各个节点及各个连接关系类别的向量表示,使得所述知识图谱用于进行对应于通过N个连接关系类别关联的所述M个节点的实体关系业务处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010089110.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top