[发明专利]基于重要性负采样的知识表示学习模型及负采样框架构建方法在审
| 申请号: | 202010436240.1 | 申请日: | 2020-05-21 |
| 公开(公告)号: | CN111797300A | 公开(公告)日: | 2020-10-20 |
| 发明(设计)人: | 喻梅;白晨;于健;于瑞国;赵满坤;刘志强;魏傲雪 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/28;G06N20/00 |
| 代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 霍慧慧 |
| 地址: | 300071*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 重要性 采样 知识 表示 学习 模型 框架 构建 方法 | ||
1.一种基于重要性负采样的知识表示学习模型构建方法,其特征在于:所述方法的步骤为:
S1、对实体和关系信息进行处理,获得得分函数和损失函数;
S2、引入循环相关运算对损失函数进行梯度下降,更新模型参数;
S3、分析实体和关系嵌入向量中的值,验证该模型具有完全表达性;
S4、利用参数绑定将背景知识融入到该模型中,以改善模型的训练效果;
S5、通过实验评估和验证对知识表示学习模型的效果进行测试。
2.根据权利要求1所述的基于循环和重要性负采样的知识表示学习模型构建方法,其特征在于:所述步骤S1的具体操作为:将实体e表示成两个向量——头向量he和尾向量te,将关系r也表示成两个向量——正向量vr和逆向量vr-1,在此基础上分别定义模型的得分函数和损失函数,模型的损失函数是对数似然损失函数。
3.根据权利要求1所述的基于循环和重要性负采样的知识表示学习模型构建方法,其特征在于:所述步骤S2的具体操作为:引入循环卷积运算,令在其上定义运算a*b,是卷积运算符,
4.根据权利要求1所述的基于循环和重要性负采样的知识表示学习模型构建方法,其特征在于:所述步骤S3的具体操作为:
a、令表示实体和关系的嵌入均为对于每一个实体ei,令的的第i位为1,其他位为0,对每一个关系rj,令的第位为1,其他位为0;
b、在模型中将头实体的头向量与尾实体的尾向量做循环相关运算,再将得到的向量与关系的正向量做点乘,将其转化为关系的正向量与头实体的头向量先做循环卷积运算,然后将得到的向量与尾实体的尾向量做点乘;对于正确的三元组,得分为1,对于错误的三元组,它的得分为-1。
5.根据权利要求1所述的基于循环和重要性负采样的知识表示学习模型构建方法,其特征在于:所述步骤S4的具体操作为:将对称性关系、反对称性关系和互逆关系等背景知识利用参数绑定融入模型中,且背景知识的融入具有选择性而并非强制。
6.根据权利要求1所述的基于循环和重要性负采样的知识表示学习模型构建方法,其特征在于:所述步骤S5的具体操作为:采用知识表示学习中最常用的两个数据集FB15K和WN18数据集,并对WN18做了一些修改构成新的数据集WN18_bk作为验证模型可以将背景知识融入知识表示模型以改善模型的训练效果的实验的数据集,将SimpleE_CC模型与CP、RESCAL、TransE、TransR、DistMult、STransE、HolE、ComplEx、SimplE等经典知识表示模型对比,调参后进行链接预测实验,对MRR、MR、Hits@N等指标进行计算,从而实现对模型效果的评估。
7.一种基于重要性负采样的负采样框架构建方法,其特征在于:所述方法的步骤为:
1)对实体集ε里的所有实体的嵌入和关系集里的所有关系的嵌入进行初始化;
2)开始进行训练,一共迭代T次;
3)通过实验评估和验证对负采样框架的效果进行测试。
8.根据权利要求7所述的基于重要性负采样的负采样框架构建方法,其特征在于:所述步骤1)的具体操作为:初始化实体和关系的嵌入,并将它们的每一维都随机初始化到内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010436240.1/1.html,转载请声明来源钻瓜专利网。





