[发明专利]一种知识图谱构建方法、装置及电子设备在审
申请号: | 202110653469.5 | 申请日: | 2021-06-11 |
公开(公告)号: | CN115470356A | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 龙铭刚;吴镁;姜伟浩;浦世亮 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孟维娜;丁芸 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 构建 方法 装置 电子设备 | ||
本发明实施例提供了一种知识图谱构建方法、装置及电子设备。其中,所述方法包括:对目标文本进行属性标记,确定所述目标文本中存在的各个属性以及所述各个属性的类别;在所述各个属性中确定类别为预设类别的属性,作为实体提及,其中,所述预设类别的属性为预先设置的能够唯一标识所描述的实体的属性;针对每个实体提及,确定在所述目标文本中与该实体提及关联且不为实体提及的属性,得到该实体提及所标识的实体的属性;确定各实体提及在所述目标文本中的关联关系,得到各实体提及所标识的实体之间的关系;根据各实体提及所标识的实体的属性以及各实体提及所标识的实体之间的关系构建知识图谱。可以使得构建得到的知识图谱中信息更加全面。
技术领域
本发明涉及知识图谱技术领域,特别是涉及一种知识图谱构建方法、装置及电子设备。
背景技术
知识图谱中包括节点和边,其中节点用于表示实体,边用于连接两个节点,并且用于表示该两个节点所表示的实体之间的关系。因此知识图谱为用于表示实体以及实体之间的关系的知识网络。许多应用的实现需要基于知识图谱所表示的实体以及实体之间的关系,因此如何准确构建知识图谱成为亟待解决的技术问题。
相关技术中,可以从非结构文本中抽取用于表示实体与实体之间的关系的关系三元组和用于表示实体的属性的属性三元组,并基于提取到的关系三元组和属性三元组构建知识图谱。
但是,如果在非结构文本中实体和/或属性未以三元组的形式出现,则该实体或属性无法被抽取到,示例性的,如果非结构文本中存在孤立的实体[小明],则在构建得到的知识图谱中将无法体现出[小明]这一实体,导致知识图谱中的信息相对非结构文本中的信息有所缺失,即构建得到的知识图谱中的信息不够全面。
发明内容
本发明实施例的目的在于提供一种知识图谱构建方法、装置及电子设备,以使得构建得到的知识图谱中的信息更全面。具体技术方案如下:
在本发明实施例的第一方面,提供了一种知识图谱构建方法,所述方法包括:
对目标文本进行属性标记,确定所述目标文本中存在的各个属性以及所述各个属性的类别;
在所述各个属性中确定类别为预设类别的属性,作为实体提及,其中,所述预设类别的属性为预先设置的能够唯一标识所描述的实体的属性;
针对每个实体提及,确定在所述目标文本中与该实体提及关联且不为实体提及的属性,得到该实体提及所标识的实体的属性;
确定各实体提及在所述目标文本中的关联关系,得到各实体提及所标识的实体之间的关系;
根据各实体提及所标识的实体的属性以及各实体提及所标识的实体之间的关系构建知识图谱。
在一种可能的实施例中,所述对目标文本进行属性标记,确定所述目标文本中存在的各个属性以及所述各个属性的类别,包括:
将目标文本输入至预先经过训练的属性标记模型,得到所述属性标记模型输出的所述目标文本中存在的各个属性以及所述各个属性的类别;
其中,所述属性标记模型包括第一预训练子模型和标记子模型,所述第一预训练子模型的输入为输入至所述属性标记模型的文本,输出为所输入的文本中包含的各个分词的词向量,所述标记子模型的输入为所述各个分词的词向量,输出为各个分词中存在的属性以及属性的类别,所述第一预训练子模型是通过无监督学习的方式训练得到的。
在一种可能的实施例中,所述针对每个实体提及,确定在所述目标文本中与该实体提及关联且不为实体提及的属性,得到该实体提及所标识的实体的属性,包括:
针对每个实体提及以及每个不为实体提及的属性,将该实体提及、该属性以及所述目标文本输入至预先经过训练的关系判断模型,得到所述关系判断模型输出的第一输出结果,所述第一输出结果用于表示该实体提及与该属性在所述目标文本中的关联关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110653469.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:食物信息的识别方法、装置、设备及存储介质
- 下一篇:基板处理装置