[发明专利]一种知识图谱构建方法、装置及电子设备在审
申请号: | 202110653469.5 | 申请日: | 2021-06-11 |
公开(公告)号: | CN115470356A | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 龙铭刚;吴镁;姜伟浩;浦世亮 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孟维娜;丁芸 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 构建 方法 装置 电子设备 | ||
1.一种知识图谱构建方法,其特征在于,所述方法包括:
对目标文本进行属性标记,确定所述目标文本中存在的各个属性以及所述各个属性的类别;
在所述各个属性中确定类别为预设类别的属性,作为实体提及,其中,所述预设类别的属性为预先设置的能够唯一标识所描述的实体的属性;
针对每个实体提及,确定在所述目标文本中与该实体提及关联且不为实体提及的属性,得到该实体提及所标识的实体的属性;
确定各实体提及在所述目标文本中的关联关系,得到各实体提及所标识的实体之间的关系;
根据各实体提及所标识的实体的属性以及各实体提及所标识的实体之间的关系构建知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述对目标文本进行属性标记,确定所述目标文本中存在的各个属性以及所述各个属性的类别,包括:
将目标文本输入至预先经过训练的属性标记模型,得到所述属性标记模型输出的所述目标文本中存在的各个属性以及所述各个属性的类别;
其中,所述属性标记模型包括第一预训练子模型和标记子模型,所述第一预训练子模型的输入为输入至所述属性标记模型的文本,输出为所输入的文本中包含的各个分词的词向量,所述标记子模型的输入为所述各个分词的词向量,输出为各个分词中存在的属性以及属性的类别,所述第一预训练子模型是通过无监督学习的方式训练得到的。
3.根据权利要求1所述的方法,其特征在于,所述针对每个实体提及,确定在所述目标文本中与该实体提及关联且不为实体提及的属性,得到该实体提及所标识的实体的属性,包括:
针对每个实体提及以及每个不为实体提及的属性,将该实体提及、该属性以及所述目标文本输入至预先经过训练的关系判断模型,得到所述关系判断模型输出的第一输出结果,所述第一输出结果用于表示该实体提及与该属性在所述目标文本中的关联关系;
如果所述第一输出结果表示该实体提及与该属性存在关联关系,将该属性确定为该实体提及所标识的实体的属性;
所述确定各实体提及在所述目标文本中的关联关系,得到各实体提及所标识的实体之间的关系,包括:
针对每两个实体提及,将该两个实体提及以及所述目标文本输入至所述关系判断模型,得到所述关系判断模型输出的第二输出结果,所述第二输出结果用于表示该两个实体提及在所述目标文本中的关联关系;
根据所述第二输出结果所表示的关联关系,确定该两个实体提及所标识的实体间的关联关系;
其中,所述关系判断模型包括第二预训练子模型和判断子模型,所述第二预训练子模型的输入为输入至所述关系判断模型的文本,输出为所输入的文本中包含的各个分词的词向量,所述判断子模型的输入为所述各个分词的词向量以及输入至所述关系判断模型的属性,输出为输入至所述关系判断模型的属性之间的关联关系,所述第二预训练子模型是通过无监督学习的方式训练得到的。
4.根据权利要求1所述的方法,其特征在于,在所述根据各实体提及所标识的实体的属性以及各实体提及所标识的实体之间的关系构建知识图谱之后,所述方法还包括:
判断任意两个实体提及所标识的实体是否相同;
如果所述任意两个实体提及所标识的实体相同,合并所述任意两个实体提及所标识的实体。
5.根据权利要求4所述的方法,其特征在于,所述判断任意两个实体提及所标识的实体是否相同,包括:
判断任意两个实体提及是否属于针对同一实体预设的标识库,其中,所述标识库中包括同一实体的多个标识;
如果所述任意两个实体提及属于针对同一实体预设的标识库,确定所述任意两个实体提及所标识的实体相同。
6.根据权利要求4所述的方法,其特征在于,所述判断任意两个实体提及所标识的实体是否相同,包括:
确定任意两个实体提及所标识的实体的属性是否匹配;
如果所述任意两个实体提及所标识的实体的属性匹配,确定所述任意两个实体提及所标识的实体相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110653469.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:食物信息的识别方法、装置、设备及存储介质
- 下一篇:基板处理装置