[发明专利]知识图谱嵌入模型的训练方法、装置、计算机设备在审
申请号: | 202110862705.4 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113568987A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 李肯立;邓石桥;肖正;陈岑;段明星;刘楚波;阳王东;唐卓 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 聂榕 |
地址: | 410013 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 嵌入 模型 训练 方法 装置 计算机 设备 | ||
本申请涉及一种知识图谱嵌入模型的训练方法、装置、计算机设备和存储介质。方法包括:获取作为训练样本的知识图谱输入图,对知识图谱输入图进行初步分区,得到两个分区,根据分区结果确定切边顶点;根据关键边和一般边,计算各切边顶点的增益值;当切边顶点的增益值大于预设值时,确定切边顶点位于关键路径上且切边顶点与关键路径不在同一分区,将切边顶点从原分区移动至另一分区,得到最终分区结果;对最终分区结果进行参数化处理,得到知识图谱的实体嵌入参数和关系嵌入参数的训练样本集;使工作节点根据训练样本集对知识图谱嵌入模型进行模型训练,得到训练后的知识图谱嵌入模型。采用本方法能够完善知识图谱嵌入模型推理组合关系能力。
技术领域
本申请涉及知识图谱技术领域,特别是涉及一种知识图谱嵌入模型的训练方法、装置、计算机设备和存储介质。
背景技术
随着知识图谱技术的发展,各大搜索引擎公司为了进一步提高网页的搜索能力,出现了知识图谱嵌入模型的训练方法技术。
传统技术中,亚马逊团队提出DGL_KE模型,DGL_KE模型采用无向图划分器METIS对知识图谱进行划分,METIS分区可以保证分区之间的切边数最小,同时保证各个分区之间负载均衡,从而尽可能地将不同计算单元之间的通信量降到了最少。
然而,目前的传统方法,忽视了知识图谱的路径信息也是一条完整的语义信息,在切边划分时,没有将路径信息考虑进去,破坏了原本的知识图谱的语义信息,将影响知识图谱嵌入模型推理组合关系的能力。
发明内容
基于此,有必要针对上述技术问题,提供一种能够完善知识图谱嵌入模型推理组合关系能力的知识图谱嵌入模型的训练方法、装置、计算机设备和存储介质。
一种知识图谱嵌入模型的训练方法,所述方法包括:
获取作为训练样本的知识图谱输入图,所述知识图谱输入图包括多个事实三元组;所述事实三元组包括头部实体、尾部实体、以及头部实体与尾部实体之间的关系,将所述知识图谱输入图的顶点用于表示所述头部实体和尾部实体,将所述知识图谱输入图的边用于表示关系,所述边包括位于关键路径上的关键边和位于一般路径上的一般边;
对知识图谱输入图进行初步分区,得到两个分区,根据分区结果确定切边顶点,所述切边顶点为不同分区的任意边的两个顶点;
根据所述关键边和所述一般边,计算各切边顶点的增益值,所述增益值表示切边顶点在关键路径上的可能性。
当所述切边顶点的增益值大于预设值时,确定所述切边顶点位于关键路径上且所述切边顶点与所述关键路径不在同一分区,将所述切边顶点从原分区移动至另一分区,得到最终分区结果;
对所述最终分区结果进行参数化处理,得到知识图谱的实体嵌入参数和关系嵌入参数的训练样本集;所述实体嵌入参数为事实三元组的头部实体和尾部实体的参数化表示,所述关系嵌入参数为事实三元组的关系的参数化表示;
使工作节点根据所述训练样本集对知识图谱嵌入模型进行模型训练,得到训练后的知识图谱嵌入模型。
在其中一个实施例中,顶点包括源顶点和目标顶点,将所述头部实体作为源顶点,将所述尾部实体作为目标顶点,所述方法还包括:
基于所述知识图谱输入图中的各源顶点、目标顶点和边,将分区中从源顶点出发到目标顶点,所经过的边的数量最多的路径,作为关键路径;并将其他不是关键路径的路径,确定作为一般路径。
在其中一个实施例中,根据所述关键边和一般边,计算各切边顶点的增益值,包括:
将所述关键边的数值设为第一值,并将所述一般边设为第二值;
针对各所述切边顶点:
查找该切边顶点所在的各关键边和一般边;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110862705.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据脱敏方法及装置
- 下一篇:一种基于强化学习的内存地址映射方法