[发明专利]知识图谱嵌入模型的训练方法、装置、计算机设备在审
申请号: | 202110862705.4 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113568987A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 李肯立;邓石桥;肖正;陈岑;段明星;刘楚波;阳王东;唐卓 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 聂榕 |
地址: | 410013 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 嵌入 模型 训练 方法 装置 计算机 设备 | ||
1.一种知识图谱嵌入模型的训练方法,其特征在于,所述方法包括:
获取作为训练样本的知识图谱输入图,所述知识图谱输入图包括多个事实三元组;所述事实三元组包括头部实体、尾部实体、以及头部实体与尾部实体之间的关系,将所述知识图谱输入图的顶点用于表示所述头部实体和尾部实体,将所述知识图谱输入图的边用于表示关系,所述边包括位于关键路径上的关键边和位于一般路径上的一般边;
对知识图谱输入图进行初步分区,得到两个分区,根据分区结果确定切边顶点,所述切边顶点为不同分区的任意边的两个顶点;
根据所述关键边和所述一般边,计算各切边顶点的增益值,所述增益值表示切边顶点在关键路径上的可能性。
当所述切边顶点的增益值大于预设值时,确定所述切边顶点位于关键路径上且所述切边顶点与所述关键路径不在同一分区,将所述切边顶点从原分区移动至另一分区,得到最终分区结果;
对所述最终分区结果进行参数化处理,得到知识图谱的实体嵌入参数和关系嵌入参数的训练样本集;所述实体嵌入参数为事实三元组的头部实体和尾部实体的参数化表示,所述关系嵌入参数为事实三元组的关系的参数化表示;使工作节点根据所述训练样本集对知识图谱嵌入模型进行模型训练,得到训练后的知识图谱嵌入模型。
2.根据权利要求1所述的方法,其特征在于,顶点包括源顶点和目标顶点,将所述头部实体作为源顶点,将所述尾部实体作为目标顶点,所述方法还包括:
基于所述知识图谱输入图中的各源顶点、目标顶点和边,将分区中从源顶点出发到目标顶点,所经过的边的数量最多的路径,作为关键路径;并将其他不是关键路径的路径,确定作为一般路径。
3.根据权利要求1所述的方法,其特征在于,根据所述关键边和一般边,计算各切边顶点的增益值,包括:
将所述关键边的数值设为第一值,并将所述一般边设为第二值;
针对各所述切边顶点:
查找该切边顶点所在的各关键边和一般边;
根据各关键边的第一值,和各一般边的第二值进行计算,得到所述切边顶点的增益值。
4.根据权利要求1所述的方法,其特征在于,在根据所述关键边和所述一般边,计算各切边顶点的增益值之后,还包括:
将增益值大于预设值的各切边顶点存储于增益堆中;
将各切边顶点对应的增益值从大到小排序,设置所述增益堆中增益值最大的所述切边顶点,优先从原分区移动至另一分区。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对上一级粗化图粗化,得到该级粗化图,各级粗化图为对所述知识图谱输入图逐级粗化得到的,所述上一级粗化图包括知识图谱输入图或者粗化图中的至少一种;
根据该级粗化图,确定该级粗化图对应的更新前聚类;
遍历所述更新前聚类是否存在环,当确定所述更新前聚类存在环,删除构成环的对应顶点,更新所述更新前聚类得到更新后聚类;
将属于所述更新后聚类的顶点作为一个新的顶点复制到下一级粗化图,并返回至根据该级粗化图,确定该级粗化图对应的更新前聚类的步骤,直至最后一级粗化图的图规模大小达到预设条件为止,并得到最后一级粗化图。
6.根据权利要求5所述的方法,其特征在于,遍历所述更新前聚类是否存在环,包括:
针对所述更新前聚类的各个顶点,
从所述更新前聚类选择所述顶点,遍历与所述顶点相连的其他顶点;
当所述更新前聚类内存在与该顶点相连的其他顶点时,执行确定所述更新前聚类内存在环的步骤。
7.根据权利要求5所述的方法,其特征在于,根据该级粗化图,确定该级粗化图对应的更新前聚类,包括:
计算该级粗化图中各顶点的拓扑值,所述拓扑值为从入度为0的顶点到该顶点最长的一条路径;
分别计算各顶点的拓扑值,与所述入度为0的顶点的拓扑值之间的差值,得到拓扑差值,所述拓扑差值为绝对值形式;
将各所述拓扑差值不大于阈值的顶点聚合为更新前聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110862705.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据脱敏方法及装置
- 下一篇:一种基于强化学习的内存地址映射方法