[发明专利]公共文化知识图谱平台及其使用办法在审
申请号: | 201611170815.X | 申请日: | 2016-12-16 |
公开(公告)号: | CN106815307A | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 王健;张桂刚;杨颐;黄卫星 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/02 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙)11482 | 代理人: | 郭文浩,李飞 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 公共 文化 知识 图谱 平台 及其 使用 办法 | ||
技术领域
本发明属于公共文化大数据共享服务领域,具体涉及计算机知识管理和知识挖掘的人工智能方法,特别涉及一种公共文化知识图谱平台及其使用办法。
背景技术
公共文化服务是指为公众提供的文化信息、文化资源的服务。随着网络公共文化服务的快速发展,产生了大量的文化资源和数据。解决网络公共文化资源共享的问题,成了公共文化服务的重点。在这些文化资源和数据中,蕴含着大量的文化知识。相对于单调的资源列表,公众更喜欢从资源中挖掘出的知识。这些知识连接着各种不同的资源,因此,基于知识的资源共享,成为了一种更高层次的公共文化共享服务。
知识图谱是前沿人工智能技术,其基本思想来自于知识库技术,能够挖掘、管理、和分析大量的知识。知识图谱技术是一种交叉领域技术,涉及到知识工程、信息检索、语义网、大数据、自然语言处理、可视化技术、人工智能、机器学习、深度学习等领域。知识图谱可以将大规模数据中的隐藏的知识抽取出来,构建一个基于图的数据模型。对于知识图谱,可以使用多种分析方法进行深度的挖掘和分析。知识图谱应用广泛,可以用于认知研究、知识检索、语义搜索引擎、个性化推荐、金融欺诈分析、知识可视化等。知识图谱分为通用知识图谱和领域知识图谱。通用知识图谱,如Google Knowledge Graph等,整合各个领域的知识,知识面广泛,但不深入。领域知识图谱服务于某一个特定领域,知识领域比较集中,但有较好的专业性和深度。
问题:当前的公共文化共享服务还停留在数据资源共享的阶段,用户获得的是列出的资源,例如,用户检索一个知识点,传统的检索系统返回给用户资源列表,用户必须逐个查看资源,从中提取和理解每个资源中的知识,其中还存有大量重复的知识。繁琐且枯燥的过程让用户对公共文化资源的兴趣迅速衰减。如何实现对公共文化知识领域中的快速、高效搜索公共文化知识成为了亟待解决的问题。
发明内容
为了解决现有技术中的上述问题,即为了解决如何实现对公共文化知识领域中的快速、高效搜索公共文化知识的问题,本发明提供了一种公共文化知识图谱平台,包括:
用于采集公共文化知识的采集处理系统,用于存储经所述采集处理系统所采集处理后的公共文化知识的存储处理系统,用于将所述存储处理系统所存储的公共文化知识进行分析处理的分析处理系统,提供公共文化知识查询的服务处理系统和对各处理系统实现调配管理的管理系统。
优选地,所述采集处理系统包括数据采集处理模块、知识模板模块和知识挖掘模块;
所述数据采集处理模块,具体包括用于采集所有数据源并对其进行相应处理;
所述知识模板模块,用于在所述数据采集处理模块处理数据源时提供模板支持作为判定依据;
所述知识挖掘模块,用于在所述数据采集处理模块处理的数据中进行公共文化知识挖掘。
优选地,所述数据采集处理模块具体包括采集单元、数据清洗单元、数据转换单元、判定器单元和自然语言处理单元,
所述采集单元,用于采集数据源;
所述数据清洗单元,用于将所述采集单元所采集的所有数据源进行噪声数据消除和数据消重处理;
所述判定器单元,用于对所述数据清洗单元处理前的数据进行有效性判定,当判定结果为无效数据时,由所述数据清洗单元进行数据清洗;否则保留数据。
所述数据转换单元,用于将经所述数据清洗单元清洗后的数据进行格式转换;
所述自然语言处理单元,用于将经所述数据转换单元格式转换后的数据进行自然语言处理后存储。
优选地,所述知识挖掘模块具体包括知识抽取单元、知识融合单元、知识扩展单元和知识验证单元,
所述知识抽取单元与所述自然语言处理单元通信连接,用于将经所述语言处理单元自然语言处理后得到的数据中提取出公共文化实体,以及实体之间的语义关系;
所述知识融合单元,用于对相同实体或相似实体的融合、相同实体属性或相似实体属性的融合,以及相同实体关系或相似实体关系的融合;
所述知识扩展单元,用于对所述存储处理系统中所存储的公共文化知识进行数据扩展挖掘;
所述知识验证单元,用于对经所述知识融合单元和所述知识扩展单元处理后的公共文化知识进行验证,验证后的公共文化知识由所述存储处理系统保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611170815.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:日志解析方法及装置
- 下一篇:面向大数据分析的洋葱式数据组织方法及系统