[发明专利]一种知识图谱嵌入训练方法和相关装置在审
申请号: | 202110013880.6 | 申请日: | 2021-01-06 |
公开(公告)号: | CN112685573A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 陈川;杜尔鑫;郑子彬 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨小红 |
地址: | 510275 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 嵌入 训练 方法 相关 装置 | ||
本申请公开了一种知识图谱嵌入训练方法和相关装置,方法包括:获取知识图谱图结构中的网络拓扑信息;根据相似度计算方法和所述网络拓扑信息,计算所述知识图谱图中不同实体节点之间的第一相似度距离;基于所述第一相似度距离、所述知识图谱图中正样例和负样例包括的实体节点,计算所述正样例和负样例之间的第二相似度距离;根据各所述负样例对应的所述第二相似度距离,计算该负样例对应的综合权重;根据所述正样例、所述负样例和各所述负样例和对应的综合权重进行对应类型的模型训练,得到知识图谱嵌入表示。解决了现有对知识图谱嵌入的训练过程中,对不同负样例一视同仁,可能导致嵌入表示的结果准确度较低的技术问题。
技术领域
本申请涉及知识图谱技术领域,尤其涉及一种知识图谱嵌入训练方法和相关装置。
背景技术
所谓知识图谱,即揭示实体之间关系的语义网络,它利用图结构形式化地描述并储存现实世界的复杂的事物及其相互关系。知识图谱嵌入研究的发展,使大量存在于现实世界的人类文字符号数据集能够被机器理解,利用并加以拓展,因此知识图谱的出现使智能搜索、个性化推荐和智能问答等相关应用表现更优。但现实世界是异常复杂的,要包含现实世界的所有关系是异常庞大的工程。
知识图谱嵌入的工作是通过机器学习的有监督训练,将研究对象的语义信息表示为低维连续向量。在嵌入的训练过程中,引入的不同负样例之间是存在差异的,然而现有在进行嵌入训练的过程中,所有的负样例一视同仁,可能导致嵌入表示的结果准确度较低。
发明内容
本申请提供了一种知识图谱嵌入训练方法和相关装置,解决了现有对知识图谱嵌入的训练过程中,对不同负样例一视同仁,可能导致嵌入表示的结果准确度较低的技术问题。
有鉴于此,本申请第一方面提供了一种知识图谱嵌入训练方法,包括:
获取知识图谱图结构中的网络拓扑信息;
根据相似度计算方法和所述网络拓扑信息,计算所述知识图谱图中不同实体节点之间的第一相似度距离;
基于所述第一相似度距离、所述知识图谱图中正样例和负样例包括的实体节点,计算所述正样例和负样例之间的第二相似度距离;
根据各所述负样例对应的所述第二相似度距离,计算该负样例对应的综合权重;
根据所述正样例、所述负样例和各所述负样例和对应的综合权重进行对应类型的模型训练,得到知识图谱嵌入表示。
可选地,根据相似度计算方法和所述网络拓扑信息,计算所述知识图谱图中不同实体节点之间的第一相似度距离,具体包括:
根据欧式距离计算方法和所述网络拓扑信息,计算所述知识图谱图中不同实体节点之间的第一相似度距离。
可选地,根据相似度计算方法和所述网络拓扑信息,计算所述知识图谱图中不同实体节点之间的第一相似度距离,具体包括:
根据余弦距离计算方法和所述网络拓扑信息,计算所述知识图谱图中不同实体节点之间的第一相似度距离。
可选地,基于所述第一相似度距离、所述知识图谱图中正样例和负样例包括的实体节点,计算所述正样例和负样例之间的第二相似度距离,具体包括:
获取知识图谱图中的正样例和该正样例对应的负样例;
获取所述正样例中的第一节点和所述负样例中的第二节点,其中,所述第一节点为所述正样例中的实体节点,所述第二节点为所述负样例中的实体节点;
将所述第一节点和所述第二节点之间的第一相似度距离作为所述正样例和所述负样例之间的第二相似度距离。
可选地,根据各所述负样例对应的所述第二相似度距离,计算该负样例对应的综合权重,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110013880.6/2.html,转载请声明来源钻瓜专利网。