[发明专利]一种基于Mf_SimplE的知识图谱表示学习方法在审
申请号: | 202111415632.0 | 申请日: | 2021-11-25 |
公开(公告)号: | CN114091461A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 刘杰;曹梦媛 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/28 |
代理公司: | 上海德誉达专利代理事务所(普通合伙) 31426 | 代理人: | 曹翠翠 |
地址: | 150000 黑龙江省哈尔*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 mf_simple 知识 图谱 表示 学习方法 | ||
本发明公开了一种基于MfSimplE的知识图谱表示学习方法,涉及互联网技术领域,具体为一种基于MfSimplE的知识图谱表示学习方法,具体包括如下步骤:S1、对知识图谱中的三元组进行预处理生成负三元组:读取知识图谱数据中的一批三元组S,对于S中任意的三元组(e1,r,e2),如果选择头部节点,则从实体集E中随机选择除e1以外的节点来替换e1组成新的负三元组,以同样的方式也可以通过替换尾结点来得到负三元组;S2、随机初始化实体节点和关系向量。本发明改进了传统方法在较复杂的知识图谱中解决一对多、多对一类型的关系不够好的问题,在没有明显增加时间复杂度的基础上相较于别的轻量级模型的精确度却有很大的提高。
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于Mf_SimplE的知识图谱表示学习方法
背景技术
随着互联网技术的高速发展,数据的来源渠道越来越广,每年数据量都在呈指数级别增长。各种各样的信息通过不同的途径被呈现在人们面前,使得数据的获取也越来越方便,人们的需求从快速获取信息转换为快速定位高质量有效信息,真正通过数据来驱动某一领域发展的关键点也并非是该领域内数据信息的体量而是通过数据挖掘问题本质和规律。基于此背景,知识图谱便由于其强大的信息处理效率和知识组织能力,逐渐进入研究人员视野中,受到人们更为广泛的关注。知识表示学习将知识图谱中的实体和关系映射到连续稠密的低维向量空间,将不同来源的实体和关系映射到同一语义空间中,有效地解决了数据稀疏问题,有助于提高计算效率,同时能够充分利用对象间的语义信息,能有效缓解数据稀疏问题,从而高效地实现语义相似度计算等任务,并显著提升计算效率。
发明内容
本发明提出的基于Mf_SimplE的知识图谱表示学习方法针对现有知识图谱表示学习模型存在的不足,基于关系转换推理和多重特征提取,改进了传统方法在较复杂的知识图谱中解决一对多、多对一类型的关系不够好的问题。
本发明所要解决的技术问题在于提供了一种基于Mf_SimplE的知识图谱表示学习方法,具体包括如下步骤:
S1、对知识图谱中的三元组进行预处理生成负三元组:读取知识图谱数据中的一批三元组S,对于S中任意的三元组(e1,r,e2),如果选择头部节点,则从实体集E中随机选择除e1以外的节点来替换e1组成新的负三元组,以同样的方式也可以通过替换尾结点来得到负三元组;
S2、随机初始化实体节点和关系向量:将数据集中的实体节点和关系对应的向量进行随机均匀初始化,定义模型中的超参数,嵌入向量维度大小;
S3、设置batchsize的大小,从知识图谱中取出batchsize组三元组,从三元组中随机抽取若干个按照步骤一中的方式生成负三元组合并batchsize组原本正确的三元组构成三元组集A输入到Mf_SimplE模型中,提取出实体和关系对应的向量的一阶近似和二阶近似组成混合特征,根据混合特征计算出相似度分数,更新模型中的权重参数降低损失函数值直至收敛。
优选的,所述步骤S1中需要替换头或者尾实体结点生成负三元组,生成负三元组采用了TransE模型中破坏正确的三元组中的头结点或者尾结点的方法。
优选的,所述步骤S2中需要提取实体和节点的一阶特征和阶特征,并可需要针对数据集中提供的正三元组(e1,r,e2),需要通过SimplE模型的方法进行关系转换生成三元组(e1,r,e2)对应的逆向三元组(e2,r-1,e1),正向和逆向三元组一同进行实体和关系向量的初始化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111415632.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种牛腿兼做临时支撑的主塔下横梁施工体系及方法
- 下一篇:一种显示装置