[发明专利]一种建立知识图谱的方法及装置在审
申请号: | 201811160597.0 | 申请日: | 2018-09-30 |
公开(公告)号: | CN110019842A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 葛婷 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳欣;王宝筠 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图谱 知识文档 结构化 方法和装置 非结构化 建立关联 语义分析 预先建立 知识管理 申请 关联 管理 应用 统一 | ||
本申请实施例公开了一种建立知识图谱的方法和装置,具体为,预先建立本体图谱,然后通过对非结构化或半结构化的知识文档进行语义分析,提取知识文档中的实体以及实体所属的本体。根据本体图谱中各个实体所属的本体之间的关系,可以确定出各个所提取的实体之间的关系,以建立包括各个实体之间的关系的实体图谱。将实体图谱中的每个实体与本体图谱中该实体所属的本体分别建立关联关系,从而建立出知识图谱。本申请将独立建立实体图谱和本体图谱,并通过本体图谱和实体图谱的对应实现本体与实体的关联,所建立的知识图谱是知识文档的结构化表达,方便知识管理和应用。同时,通过管理本体图谱,可以统一对实体图谱进行管理。
技术领域
本申请涉及计算机技术领域,具体涉及一种建立知识图谱的方法及装置。
背景技术
在各个专业领域,随着时间的发展,会积累很多种类的知识。这些知识有些总结整理为书籍,有些流传于网络,有些存在于行业专家的头脑中,随着经验不断积累。这些知识构成了一个行业能够生存和发展的关键,更是行业创新不可缺少的部分。知识的归纳和整理是数字化、智能化过程中必不可少的环节。只有在原有知识的基础上,才能有更好的创新和发展。
在现有技术中,可以将知识进行收集、整理,保存到知识数据库中。但是,该方式至少对知识进行了整理,以便于检索,没有对知识进行结构化处理。知识数据库中的知识如果需要在智能化过程中应用,还需要进行大量的结构化处理,没有达到真正对某行业知识的管理及进行后续应用的目的。
发明内容
有鉴于此,本申请实施例提供一种建立知识图谱的方法及装置,以解决现有技术中知识未经结构化处理无法直接应用的技术问题。
为解决上述问题,本申请实施例提供的技术方案如下:
第一方面,本申请实施例提供了一种建立知识图谱的方法,所述方法包括:
获取预先建立的本体图谱,所述本体图谱包括各个本体之间的关系;
对知识文档进行语义分析,提取所述知识文档中的实体以及所述实体所属的本体,所述实体所属的本体在所述本体图谱中;
根据所述本体图谱中所述实体所属的本体之间的关系,确定各个所述实体之间的关系,建立包括各个所述实体之间的关系的实体图谱;
将所述实体图谱中的目标实体与所述本体图谱中所述目标实体所属的本体建立关联关系,生成知识图谱,所述目标实体分别取所述实体图谱中的每个实体。
在一种可能的实现方式中,所述实体图谱中的每个实体还具有包括该实体所属本体的本体标签。
在一种可能的实现方式中,所述将所述实体图谱中的目标实体与所述本体图谱中所述目标实体所属的本体建立关联关系,生成知识图谱,包括:
读取所述实体图谱中的目标实体的本体标签;
根据所述目标实体的本体标签在所述本体图谱中查找所述目标实体所属的本体;
将所述实体图谱中的目标实体与所述本体图谱中所述目标实体所属的本体建立关联关系,生成知识图谱。
在一种可能的实现方式中,所述方法还包括:
在所述实体图谱中查找待查找实体;
从所述实体图谱中获取与所述待查找实体具有关系的实体。
在一种可能的实现方式中,所述在所述实体图谱中查找待查找实体,包括:
获取待查找实体的本体标签;
在所述实体图谱中查找具有所述待查找实体的本体标签的实体;
在所述具有所述待查找实体的本体标签的实体中查找所述待查找实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811160597.0/2.html,转载请声明来源钻瓜专利网。