[发明专利]一种知识图谱表示系统及其实施方法有效
申请号: | 201710155940.1 | 申请日: | 2017-03-16 |
公开(公告)号: | CN106934042B | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 赵翔;谭真;方阳;曾维新;葛斌;肖卫东;唐九阳 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陆薇薇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 表示 系统 及其 实施 方法 | ||
1.一种知识图谱表示系统,其特征在于,所述表示系统包括实体空间模块、优化函数模块、系统训练模块、数据采集模块、预处理模块和特征抽取模块;
所述数据采集模块用于抽取现有知识图谱中的数据,利用分布式爬虫系统对互联网中存在的知识进行分布式的采集,并将其存储在分布式的图数据库中;
所述预处理模块用于对抽取的数据进行结构化处理,对采集到的数据进行过滤,所述过滤包括实体关系去重、过滤掉不符合描述规范实体关系以及过滤存在非法字符的实体关系;
所述特征抽取模块用于对结构化处理后的数据进行特征抽取,抽取知识图谱中包含的实体、关系和属性,并将所述实体、关系和属性用三元组的形式进行描述;
所述实体空间模块用于表示实体特征的表示空间,其包括本征态空间和拟态空间;其中,本征态空间的本征态向量用于描述实体关系本征态,拟态空间的拟态向量用于描述实体关系拟态,所述拟态向量构成拟态矩阵,拟态向量和本征态向量共同构成实体空间的特征向量;
所述优化函数模块用于表示不同实体在翻译之后的距离,其包括距离计算和权重向量赋予;所述距离计算包括计算头实体翻译后与尾实体的距离公式,所述权重向量采用权重向量赋予头尾实体的不同维度以不同的权重,以达到优化距离计算公式的目的;
所述系统训练模块用于特征训练并输出训练结果,所述训练结果用于进行知识图谱预测和分类;所述特征训练包括权重向量的动态训练以及防止过拟合参数的设置;
所述知识图谱补全模块用于进行知识图谱预测,对知识图谱中缺失的实体或者关系进行推荐、以及对现有的三元组进行正确与否的判断;
所述分类模块用于对预测结果进行分类。
2.一种如权利要求1所述的知识图谱表示系统的实施方法,其特征在于,所述方法包括以下步骤:
1)利用数据采集模块抽取现有知识图谱中的数据,利用分布式爬虫系统对互联网中存在的知识进行分布式的采集,并将其存储在分布式的图数据库中;
2)利用预处理模块对抽取的数据进行结构化处理,所述预处理模块对采集到的数据进行过滤,包括实体关系去重、过滤掉不符合描述规范实体关系以及过滤存在非法字符的实体关系;
3)利用特征抽取模块对结构化处理后的数据进行特征抽取,抽取知识图谱中包含的实体、关系、属性,并将其用三元组的形式进行描述,并利用所述知识图谱表示系统对抽取的特征进行训练;
4)利用训练好的结果通过所述知识图谱补全模块以及分类模块进行知识图谱预测和分类,所述知识图谱补全模块以及分类模块对训练好的知识图谱表示系统进行测试以验证知识图谱表示系统的有效性,实现对知识图谱中缺失的实体或者关系进行推荐、以及对现有的三元组进行正确与否的判断。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710155940.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:影像文件管理方法及装置
- 下一篇:媒体文件推荐方法、装置和系统