[发明专利]一种基于翻译模型的知识图谱表示方法有效
申请号: | 201710155956.2 | 申请日: | 2017-03-16 |
公开(公告)号: | CN106951499B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 谭真;赵翔;方阳;郭澄;葛斌;肖卫东;汤大权 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陆薇薇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于表示知识谱图的表示模型方法,其涉及知识图谱表示技术领域,该方法包括以下步骤:1)利用数据采集模块抽取现有知识图谱中的数据并进行存储;2)利用预处理模块对抽取的数据进行结构化处理;3)利用特征抽取模块对结构化处理后的数据进行特征抽取,并利用GTrans模型对抽取的特征进行训练;4)利用训练好的结果通过所述知识图谱补全模块以及分类模块进行知识图谱预测和分类。本发明的GTrans模型为每一个关系构造了一个动态关系空间,能够为每一个关系表示空间提供灵活的关系权重,以及增强关系表示的能力并减少其他关系的干扰,灵活性显著增加。 | ||
搜索关键词: | 一种 基于 翻译 模型 知识 图谱 表示 方法 | ||
【主权项】:
1.一种基于翻译模型的知识图谱表示方法,其特征在于,该方法包括以下步骤:1)利用数据采集模块抽取现有知识图谱中的数据,利用分布式爬虫系统对互联网中存在的知识进行分布式的采集,并将其存储在分布式的图数据库中;2)利用预处理模块对抽取的数据进行结构化处理,所述预处理模块对采集到的数据进行过滤,主要分为实体关系去重、过滤掉不符合描述规范实体关系以及过滤存在非法字符的实体关系三部分;3)利用特征抽取模块对结构化处理后的数据进行特征抽取,抽取知识图谱中包含的实体、关系、属性,并将其用三元组的形式进行描述,并利用训练模块对抽取的特征进行训练;其中,所述训练模块为GTrans模型,所述GTrans模型构建过程包括实体空间构建和动态空间构建,所述实体空间为用于表示实体特征的表示空间,所述动态空间为用于表示关系特征的表示空间,所述实体空间构建包括本征态和拟态以及设置本征态和拟态的权重参数;所述动态空间构建包括动态关系空间的设置;所述本征态用于描述实体固有的状态,所述拟态用于描述实体受外界改变而产生的变化状态,拟态向量构成拟态矩阵,拟态向量和本征态向量共同构成实体空间的特征向量;所述本征态和拟态的权重参数包括静态参数和动态参数两种方式;所述的动态关系空间的设置包括关系空间的距离计算公式,采用权重向量赋予头尾实体的不同维度以不同的权重,其使用标准欧式距离,并添加动态空间约束得到动态关系空间模型;4)利用训练好的结果通过知识图谱补全模块以及分类模块进行知识图谱预测和分类,所述知识图谱补全模块以及分类模块对训练好的表示模型进行测试以验证模型的有效性,实现对知识图谱中缺失的实体或者关系进行推荐、以及对现有的三元组进行正确与否的判断。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710155956.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种省力式橘红片碾压装置
- 下一篇:一种用于医用酵母打散的立式打散器