[发明专利]一种基于元学习的领域知识图谱补全方法有效
申请号: | 201911385727.5 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111046193B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 叶宁;张浩哲;徐康;王娟;黄海平;程晶晶;王汝传;陈莹;徐超;查猛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 学习 领域 知识 图谱 方法 | ||
本发明的目的是提供了一种基于元学习的领域知识图谱补全方法,提供一种知识图谱补全方式,仅依靠领域知识图谱中的少量样本实现实体补全和新知识的快速部署,从而提高领域知识图谱补全的效率。克服了小样本领域知识图谱难以自动处理、人工处理成本高的问题,通过元学习方法实现了在小样本领域中有效的三元组向量表示的获得方法。训练的元关系向量对于任务的改变具有敏感性,其训练过程相对普通的表示学习过程只增加了一个参数,在面对新领域知识时可以达到快速部署的效果,提高了计算效率。可扩展性强,可以适应表示学习中的多种损失函数,可以随效率和精度要求灵活更改损失函数。
技术领域
本发明涉及人工智能中的知识图谱领域,尤其涉及一种基于元学习的领域知识图谱补全方法。
背景技术
知识库是人类知识组成的结构化的知识系统,Google于2012年将其搜索引擎中使用的知识库命名为知识图谱。目前海内外均以“知识图谱”泛指各种知识库。作为人工认知智能的重要基础技术,知识图谱被普遍应用于智能检索、知识问答、数据整合、辅助决策等领域。现有的知识图谱普遍存在数据稀疏,完备性不足的问题,大量实体间的隐含关系还未被发现,需要通过知识图谱补全方法进行完善和补充。在知识图谱补全等任务中主要采用表示学习技术,利用机器学习算法将知识图谱中实体和关系映射到低维的向量空间,得到知识的分布式表示。在低维空间中,实体和关系的稠密向量表示解决了数据稀疏的问题,同时可以进行的高效语义计算,通过算法实现知识图谱中的实体和关系补全。现有的表示学习模型依赖丰富的训练样本以达到良好的效果。
按照内容涵盖的范围,知识图谱可以分为通用知识图谱和领域知识图谱两种。领域知识图谱具有知识内容范围有限,专业性强的特点,这也意味着在领域知识图谱的补全任务中往往需要专家知识和人工标注,导致样本数量有限、自动化程度低、成本高等问题。
发明内容
针对现有技术的不足,本发明的目的是提供了一种基于元学习的领域知识图谱补全方法,由于现有的领域知识图谱样本数量少,样本依赖人工标注,难以自动形成有效的知识三元组分布式表示,利用元学习方法,提供一种知识图谱补全方式,仅依靠领域知识图谱中的少量样本实现实体补全和新知识的快速部署,从而提高领域知识图谱补全的效率。
本发明提供一种基于元学习的领域知识图谱补全方法,所述方法步骤如下:
步骤1:在通用知识图谱中提取领域相关范围内的实体关系三元组,定义为补全任务的元训练集DTrain;
步骤2:将待补全的小样本领域知识图谱中的三元组定义为补全任务的元测试集DTest;
步骤3:对DTrain和DTest中所有三元组进行初始化处理,得到向量表示的三元组(h,r,t),其中h为头实体向量,r为关系向量,t为尾实体向量,(h,r,t)∈G,G为三元组样本集,h,t∈E,E为实体集,r∈R,R为关系集;
步骤4:对步骤1得到的元训练集DTrain,将所有具有同一关系的三元组加入同一集合,定义为该关系对应的关系任务Tr,Tr∈T,T为所有关系任务构成的任务池;
步骤5:在任务池T中随机抽取一项任务Tr,取出NS个三元组样本作为该任务的支持集Sr,剩下的NQ个样本作为该任务的询问集Qr,其中NSNQ;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911385727.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种起毛机构
- 下一篇:家庭衣物洗护设备除味性能测试方法