[发明专利]知识图谱的更新方法、装置及计算机可读存储介质有效
| 申请号: | 201911315927.3 | 申请日: | 2019-12-19 |
| 公开(公告)号: | CN111177315B | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 薛小娜;牟小峰 | 申请(专利权)人: | 北京明略软件系统有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;栗若木 |
| 地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 知识 图谱 更新 方法 装置 计算机 可读 存储 介质 | ||
1.一种知识图谱的更新方法,其特征在于,包括:
对输入的非结构化文本进行语句分析处理;
利用预先构建的实体关系元组抽取模型抽取语句分析处理后的非结构化文本中的实体关系元组;
根据获得的实体关系元组更新知识图谱;
所述利用预先构建的实体关系元组抽取模型抽取语句分析处理后的非结构化文本中的实体关系元组之后,且所述根据获得的实体关系元组更新知识图谱之前,还包括:
判断获得的实体关系元组中的关系词是否存在于预先建立的关系词集合中;其中,所述关系词为连接所述实体关系元组中两个实体之间关系的词语,且包括:谓词、介词、修饰词、名词、动词;
当获得的实体关系元组中的关系词不存在于所述关系词集合中,删除该实体关系元组;
所述根据获得的实体关系元组更新知识图谱,包括:
根据获得的关系词存在于所述关系词集合中的目标实体关系元组更新所述知识图谱;
所述根据获得的关系词存在于关系词集合中的目标实体关系元组更新知识图谱,包括:
当所述目标实体关系元组中的实体均不存在于所述知识图谱中,将所述目标实体关系元组导入所述知识图谱;
当所述目标实体关系元组中的至少一个实体存在于所述知识图谱中,获取所述非结构化文本的特征向量,并根据所述非结构化文本的特征向量和所述目标实体关系元组更新所述知识图谱;
所述根据非结构化文本的特征向量和目标实体关系元组更新知识图谱,包括:
在所述知识图谱中查找与第一目标实体的名称相同的候选节点;其中,所述第一目标实体为所述目标实体关系元组中存在于所述知识图谱中的实体;
将所述目标实体关系元组中不存在于所述知识图谱中的第二目标实体的得分记为0;
获取所有所述候选节点的特征向量,并根据所述非结构化文本的特征向量和每个所述候选节点的特征向量计算所述非结构化为本与每个所述候选节点的相似度,并将所有相似度中最大相似度作为所述第一目标实体的得分;
根据所述目标实体关系元组中两个实体的得分更新所述知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述对输入的非结构化文本进行语句分析处理,包括:
将输入的非结构化文本按照标点符号划分为若干个语句;
对每个语句进行依存关系分析,得到每个语句的依存关系集合;
根据所述依存关系集合中的主谓关系对存在零指代的语句进行零指代消解;
根据所述依存关系集合中的并列关系对存在并列子句的语句进行划分。
3.根据权利要求2所述的方法,其特征在于,所述根据依存关系集合中的主谓关系对存在零指代的语句进行零指代消解,包括:
获取第一个语句的依存关系集合,并根据第一个语句的依存关系集合获取所述第一个语句的主谓关系SBV节点;
依次获取其他语句的依存关系集合,并每当获得一个语句的依存关系集合执行以下操作:
根据获得的语句的依存集合判断获得的语句中是否存在SBV节点;
当获得的语句中不存在SBV节点,将上一个语句的SBV节点插入获得的语句的第一个位置。
4.根据权利要求1所述的方法,其特征在于,所述实体关系元组抽取模型包括:动词结构实体关系元组抽取模型、定语结构实体关系元组抽取模型、并列结构实体关系元组抽取模型和固定结构实体关系元组抽取模型。
5.根据权利要求4所述的方法,其特征在于,所述动词结构实体关系元组抽取模型包括:及物动词关系结构实体关系元组抽取模型、轻动词关系结构实体关系元组抽取模型、不及物动词关系结构实体关系元组抽取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911315927.3/1.html,转载请声明来源钻瓜专利网。





