[发明专利]知识图谱的更新方法、装置及计算机可读存储介质有效
| 申请号: | 201911315927.3 | 申请日: | 2019-12-19 |
| 公开(公告)号: | CN111177315B | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 薛小娜;牟小峰 | 申请(专利权)人: | 北京明略软件系统有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;栗若木 |
| 地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 更新 方法 装置 计算机 可读 存储 介质 | ||
一种知识图谱的更新方法、装置及计算机可读存储介质,包括:对输入的非结构化文本进行语句分析处理;利用预先构建的实体关系元组抽取模型抽取语句分析处理后的非结构化文本中的实体关系元组;根据获得的实体关系元组更新知识图谱。由于对输入的非结构化文本进行了语句分析处理,并利用预先构建的实体关系元组抽取模型抽取了语句分析处理后的非结构化文本中的实体关系元组,因此实现了根据非结构化文本更新知识图谱,从而加快了知识图谱的更新频率,保证了后续知识图谱应用的顺利进行。
技术领域
本文涉及数据处理技术,尤指一种知识图谱的更新方法、装置及计算机可读存储介质。
背景技术
知识图谱以结构化方式来展现客观世界中实体及它们之间的关系,知识图谱能够将文本、网络信息表达成人们极易理解的形式,从而提供了一种组织、管理和理解海量信息的能力。
相关技术中,知识图谱偏静态管理,即知识图谱中的更新往往依靠结构化文本或表格等容易解析的静态文本。
然而,这种更新方法仅仅所依赖的文本来源并且数量都较少,因此致使知识图谱的更新频率较慢,从而影响知识图谱的应用。
发明内容
本申请提供了一种知识图谱的更新方法、装置及计算机可读存储介质,能够根据非结构化文本更新知识图谱,从而加快知识图谱的更新频率,保证后续知识图谱应用的顺利进行。
本申请提供了一种知识图谱的更新方法,包括:
对输入的非结构化文本进行语句分析处理;
利用预先构建的实体关系元组抽取模型抽取语句分析处理后的非结构化文本中的实体关系元组;
根据获得的实体关系元组更新知识图谱。
所述对输入的非结构化文本进行语句分析处理,包括:
将输入的非结构化文本按照标点符号划分为若干个语句;
对每个语句进行依存关系分析,得到每个语句的依存关系集合;
根据所述依存关系集合中的主谓关系对存在零指代的语句进行零指代消解;
根据所述依存关系集合中的并列关系对存在并列子句的语句进行划分。
所述根据依存关系集合中的主谓关系对存在零指代的语句进行零指代消解,包括:
获取第一个语句的依存关系结合,并根据第一个语句的依存关系集合获取所述第一语句的主谓关系SBV节点;
依次获取其他语句的依存关系集合,并每当获得一个语句的依存关系集合执行以下操作:
根据获得的语句的依存集合判断获得的语句中是否存在SBV节点;
当获得的语句中不存在SBV节点,将上一个语句的SBV节点插入获得的语句的第一个位置。
所述实体关系元组抽取模型包括:动词结构实体关系元组抽取模型、定语结构实体关系元组抽取模型、并列结构实体关系元组抽取模型和固定结构实体关系元组抽取模型。
所述动词结构实体关系元组抽取模型包括:及物动词关系结构实体关系元组抽取模型、轻动词关系结构实体关系元组抽取模型、不及物动词关系结构实体关系元组抽取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911315927.3/2.html,转载请声明来源钻瓜专利网。





