[发明专利]一种基于多视角链接预测的知识图谱补全方法及系统在审
申请号: | 202310213286.0 | 申请日: | 2023-03-08 |
公开(公告)号: | CN116361481A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 廖伟智;杨绍亮;阎德劲 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/28 |
代理公司: | 成都启慧金舟知识产权代理事务所(特殊普通合伙) 51299 | 代理人: | 何媛 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视角 链接 预测 知识 图谱 方法 系统 | ||
本说明书实施例提供一种基于多视角链接预测的知识图谱补全方法及系统,其中,所述方法包括:建立现有知识概念自动转换器;建立并训练双编码器;获取待预测三元组;现有知识概念自动转换器基于待预测三元组包括的头实体及关系,确定待预测三元组对应的候选尾实体与候选尾实体文本描述;双编码器基于候选尾实体与候选尾实体文本描述,确定候选尾实体的得分;基于候选尾实体的得分,确定待预测三元组包括的尾实体,具有提高补全知识图谱的准确度的优点。
技术领域
本说明书涉及知识图谱领域,特别涉及一种基于多视角链接预测的知识图谱补全方法及系统。
背景技术
航空电子装备全生命周期中包含电子装备的设计模型、制造模型和运维模型,各模型间的数据结构、内容和标准差异性大,且各模型数据相互独立。构建分布式设计制造运维一体化平台可以有效整合各种多态异构大差异数据,解决不同装备、产线、仪器设备和信息系统的数据采集与治理,实现多企业、多产品异构大差异模型统一构建和数据融合,实现多企业产业链及企业内多专业间复杂业务的数据集流程并行双驱动,实现数字化模型跨业务、跨企业贯通与反演。其中,多业务模型数据融合在整个分布式设计制造一体化平台建设中尤为重要。其对采集到的设计数据、制造数据和运维数据进行融合,实现统一数据源。融合后的统一数据源可用于数据分析类应用。数据融合过程中,需要构建知识图谱以支持数据融合和存储。目前,知识图谱主要通过人工或半自动的方式进行构建,部分隐含关系难以被挖掘。为了尽可能保证知识图谱完整性,对知识图谱进行补全极为必要。
因此,需要提供一种基于多视角链接预测的知识图谱补全方法及系统,用于提高补全知识图谱的准确度。
发明内容
本说明书实施例之一提供一种基于多视角链接预测的知识图谱补全方法,所述方法包括:建立现有知识概念自动转换器;建立并训练双编码器;获取待预测三元组;所述现有知识概念自动转换器基于所述待预测三元组包括的头实体及关系,确定所述待预测三元组对应的候选尾实体与候选尾实体文本描述;所述双编码器基于所述候选尾实体与候选尾实体文本描述,确定所述候选尾实体的得分;基于所述候选尾实体的得分,确定所述待预测三元组包括的尾实体。
在一些实施例中,所述建立现有知识概念自动转换器,包括:建立实体与实体现有知识概念映射字典及实体与实体文本描述映射字典;通过所述实体与实体现有知识概念映射字典及所述实体与实体文本描述映射字典,将三元组数据集中的三元组转化为现有知识概念三元组,建立所述三元组数据集相对应的现有知识概念三元组数据集。
在一些实施例中,所述建立并训练双编码器,包括:建立初始双编码器,其中,所述初始双编码器包括第一BERT模型和第二BERT模型;通过正样本及负样本,训练所述初始双编码器,生成所述双编码器。
在一些实施例中,获取所述负样本,包括:生成硬负样本及软负样本;基于现有知识,对所述软负样本进行筛选。
在一些实施例中,所述现有知识概念自动转换器基于所述待预测三元组包括的头实体及关系,确定所述待预测三元组对应的候选尾实体与候选尾实体文本描述,包括:基于所述待预测三元组包括的头实体对应的现有知识概念集合和所述待预测三元组包括的关系,确定所述待预测三元组包括的尾实体对应的候选现有知识概念集合;所述实体与实体文本描述映射字典基于所述尾实体对应的候选现有知识概念集合,确定所述待预测三元组对应的候选尾实体与候选尾实体文本描述。
在一些实施例中,所述双编码器基于所述候选尾实体与候选尾实体文本描述,确定所述候选尾实体的得分,包括:所述第一BERT模型基于所述待预测三元组中头实体对应的头实体文本描述和所述关系对应的关系文本描述,确定头实体关系感知嵌入;所述第二BERT模型基于候选尾实体文本描述,确定候选尾实体嵌入;基于所述头实体关系感知嵌入和所述候选尾实体嵌入之间的相似度,确定所述候选尾实体的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310213286.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种凝胶型驱鸟剂及其制备方法和应用
- 下一篇:分配检测装置