[发明专利]一种基于二次主题空间投影的场景图谱低维空间嵌入方法有效
申请号: | 201910027580.6 | 申请日: | 2019-01-11 |
公开(公告)号: | CN109753571B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 万海;李雷来;曾娟 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 林梅繁 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开基于二次主题空间投影的场景图谱低维空间嵌入方法,包括步骤:输入场景图谱数据集的参数;输入正例并采样替换后反例;预处理得到实体的邻居集合、实体邻居数量;对实体的描述文本进行清洗得到文本描述集合;利用主题模型输出实体文本主题向量和实体邻居主题向量;利用翻译模型得到损失向量L;利用语义超平面构造方式和翻译模型结合的方式得到投影向量s;利用s将L投影到语义平面得到在投影平面的得分,并对得分乘以参数λ,加上L得到最终得分;集合正、反例得分残差,进行各层参数反向传播得到梯度,更新各层参数继续下一轮迭代。本发明首次公开融合了邻居上下文和实体描述信息多种异质信息,取得了场景图谱表示学习更好的效果。 | ||
搜索关键词: | 一种 基于 二次 主题 空间 投影 场景 图谱 嵌入 方法 | ||
【主权项】:
1.一种基于二次主题空间投影的场景图谱低维空间嵌入方法,其特征在于,包括以下步骤:S1、输入场景图谱数据集的参数,包括三元组训练数据集K、实体集合E、关系集合R、最大迭代次数、实体和关系的向量维度;S2、依次输入正例,通过采样替换后得到它的反例,初始化实体和关系向量;S3、预处理得到每个实体e的邻居集合εn(e),得到实体邻居数量n;对实体的描述文本进行清洗,去除特殊字符、低频词和停用词,得到每个实体e的文本描述集合εd(e);S4、将实体e的邻居集合、文本描述集合输入到主题模型中,输出实体文本主题向量de和实体邻居主题向量ne;S5、利用翻译模型得到损失向量L;利用语义超平面构造方式和翻译模型结合的方式得到投影向量s;S6、利用投影向量s将损失向量L投影到一个语义平面,得到在投影平面的得分;对投影平面的得分乘以参数λ,同时加上损失向量L,得到最终的得分;S7、对每个正例重复步骤S3‑S6,得到正例得分;对每个正例,分别替换头实体、关系和尾实体,采样得到反例,重复步骤S3‑S6得到反例得分;S8、通过目标函数集合正例得分和反例得分的残差,采用随机梯度下降的方法进行所述低维空间嵌入方法实施过程中各层参数的反向传播得到梯度,并更新各层参数,继续下一轮迭代。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910027580.6/,转载请声明来源钻瓜专利网。