[发明专利]公共文化知识图谱平台及其使用办法在审
申请号: | 201611170815.X | 申请日: | 2016-12-16 |
公开(公告)号: | CN106815307A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 王健;张桂刚;杨颐;黄卫星 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/02 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙)11482 | 代理人: | 郭文浩,李飞 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 公共 文化 知识 图谱 平台 及其 使用 办法 | ||
1.一种公共文化知识图谱平台,其特征在于,包括:用于采集公共文化知识的采集处理系统,用于存储经所述采集处理系统所采集处理后的公共文化知识的存储处理系统,用于将所述存储处理系统所存储的公共文化知识进行分析处理的分析处理系统,提供公共文化知识查询的服务处理系统和对各处理系统实现调配管理的管理系统。
2.根据权利要求1所述的公共文化知识图谱平台,其特征在于,所述采集处理系统包括数据采集处理模块、知识模板模块和知识挖掘模块;
所述数据采集处理模块,具体包括用于采集所有数据源并对其进行相应处理;
所述知识模板模块,用于在所述数据采集处理模块处理数据源时提供模板支持作为判定依据;
所述知识挖掘模块,用于在所述数据采集处理模块处理的数据中进行公共文化知识挖掘。
3.根据权利要求2所述的公共文化知识图谱平台,其特征在于,所述数据采集处理模块具体包括采集单元、数据清洗单元、数据转换单元、判定器单元和自然语言处理单元,
所述采集单元,用于采集数据源;
所述数据清洗单元,用于将所述采集单元所采集的所有数据源进行噪声数据消除和数据消重处理;
所述判定器单元,用于对所述数据清洗单元处理前的数据进行有效性判定,当判定结果为无效数据时,由所述数据清洗单元进行数据清洗;否则,保留数据;
所述数据转换单元,用于将经所述数据清洗单元清洗后的数据进行格式转换;
所述自然语言处理单元,用于将经所述数据转换单元格式转换后的数据进行自然语言处理后存储。
4.根据权利要求3所述的公共文化知识图谱平台,其特征在于,所述知识挖掘模块具体包括知识抽取单元、知识融合单元、知识扩展单元和知识验证单元,
所述知识抽取单元与所述语言处理单元通信连接,用于将经所述自然语言处理单元自然语言处理后得到的数据中提取出公共文化实体,以及实体之间的语义关系;
所述知识融合单元,用于对相同实体或相似实体的融合、相同实体属性或相似实体属性的融合,以及相同实体关系或相似实体关系的融合;
所述知识扩展单元,用于对所述存储处理系统中所存储的公共文化知识进行数据扩展挖掘;
所述知识验证单元,用于对经所述知识融合单元和所述知识扩展单元处理后的公共文化知识进行验证,验证后的公共文化知识由所述存储处理系统保存。
5.根据权利要求1所述的公共文化知识图谱平台,其特征在于,所述存储处理系统用于分类存储所有的公共文化知识数据,包括存储各种结构化数据的第一存储模块、存储图片、视频数据的第二存储模块、存储知识图谱模型的第三存储模块、存储文本文档的第四存储模块、存储本体模型和规则模板的第五存储模块以及存储系统数据的第六存储模块。
6.根据权利要求5所述的公共文化知识图谱平台,其特征在于,所述第一存储模块具体为关系型数据库集群,所述第二存储模块具体为分布式文件系统,所述第三存储模块具体为图数据库,所述第四存储模块具体为文档数据库,所述第五存储模块具体为可扩展标记语言XML,以及所述第六存储模块具体为列数据库。
7.根据权利要求1所述的公共文化知识图谱平台,其特征在于,所述公共文化知识图谱平台还包括与所述管理系统通信连接的调配处理系统,所述调配处理系统用于根据所述管理系统的指示对其所连接的各处理系统进行统一调配处理。
8.根据权利要求7所述的公共文化知识图谱平台,其特征在于,所述调配处理系统中还包括用于为所述分析处理系统提供数据分析时所需使用计算框架的计算框架模块,为所述分析处理系统提供数据分析时所需使用算法的算法库模块,以及为所述存储处理系统中所存储的模型提供配置的模型管理模块。
9.一种基于权利要求1-8所述的公共文化知识图谱平台的使用方法,其特征在于,包括:
接收公共文化知识的查询请求;
根据所述查询请求查询公共文化知识;
将查询到的公共文化知识进行展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611170815.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:日志解析方法及装置
- 下一篇:面向大数据分析的洋葱式数据组织方法及系统