[发明专利]知识图谱工程化构建方法、装置、计算机设备和存储介质有效
申请号: | 202011570692.5 | 申请日: | 2020-12-26 |
公开(公告)号: | CN112650855B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 赵艳楠;宋怀明;郭庆;蒋丹东;刘玉海 | 申请(专利权)人: | 曙光信息产业股份有限公司;曙光信息产业(北京)有限公司;中科曙光信息产业成都有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/205 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 方高明 |
地址: | 300000 天津市西青区华*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 工程 构建 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种知识图谱工程化构建方法、装置、计算机设备和存储介质。所述方法包括:获取至少一个标识解析体系中的结构化数据样本对应的编码标识,编码标识用于唯一表示结构化数据样本中的实体数据;解析结构化数据样本对应的编码标识,得到对应的实体数据的基本信息;根据解析出的实体数据的基本信息与工程流程数据进行数据匹配,得到结构化数据样本中各实体数据间的属性关联关系;根据属性关联关系以及预设的属性图模型,生成对应的知识图谱。采用本方法能够工程化构建知识图谱,提供知识图谱构建效率。
技术领域
本申请涉及知识图谱技术领域,特别是涉及一种知识图谱工程化构建方法、装置、计算机设备和存储介质。
背景技术
传统的知识图谱侧重于表达实体对象与概念之间的语义关联。这些语义关联是静态的,显性的且客观的,然而企业实际应用中研发、设计、生产过程中的知识图谱需要具备过程性和决策性,这部分知识是动态的、隐形的。
目前,针对该类动态知识图谱的构建,行业内的知识图谱所需的动态数据,例如,核心实体、属性关系信息、关系和事件多来源于行业内部的结构化数据(例如数据库),但是由于各行业的数据库中的数据往往存在数据标准不统一,缺乏元数据描述、数据字典不全、不具备数据标识一致性等问题,再基于技术人员的经验进行人工概念筛选和组织,导致无法针对批量结构化数据,进行工程化的知识图谱构建。
发明内容
基于此,有必要针对上述技术问题,提供一种知识图谱工程化构建方法、装置、计算机设备和存储介质。
一种知识图谱工程化构建方法,所述方法包括:
获取至少一个标识解析体系中的结构化数据样本对应的编码标识,所述编码标识用于唯一表示所述结构化数据样本中的实体数据;
解析所述结构化数据样本对应的编码标识,得到对应的实体数据的基本信息;
根据解析出的所述实体数据的基本信息与工程流程数据进行数据匹配,得到所述结构化数据样本中各实体数据间的属性关联关系;
根据所述属性关联关系以及预设的属性图模型,生成对应的知识图谱。
本实施例中,通过解析标识解析体系中的实体数据的标识编码得到实体数据的基本信息,进而进行知识图谱的关系构建,保证了知识图谱中数据的结构化程度,同时通过标识解析体系中实体数据包含的基本信息和工程流程数据进行匹配,抽取实体数据间的属性关系,提高了知识图谱的工程化构建程度。
在其中一个实施例中,在所述解析所述结构化数据样本对应的编码标识之前,所述方法还包括:
识别所述结构化数据样本中每一所述实体数据对应的编码标识;
若所述实体数据的编码标识为非通用标识体系中的编码标识,则根据预设的标识转换关系,在所述实体数据的编码标识中添加预设的标识前缀,得到所述实体数据转换后的编码标识。
本实施例中,通过正则表达式预先识别获取到的结构化数据样本中每一实体数据的编码标识,并根据预设的编码转换规则对非通用编码标识进行转换,保证了不同标识解析体系下的实体数据可以通过转换后编码标识进行唯一表示。
在其中一个实施例中,根据解析出的所述实体数据的基本信息与工程流程数据进行数据匹配,得到所述结构化数据样本中各实体数据间的属性关联关系,包括:
获取所述标识解析体系对应的工程流程数据,所述工程流程数据中包含工作流程应用场景下的操作实体和对应的操作属性;
根据所述操作实体和对应的操作属性在所述实体数据的基本信息中进行匹配和关系抽取,得到所述结构化数据样本中各所述实体数据间的属性关联关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业股份有限公司;曙光信息产业(北京)有限公司;中科曙光信息产业成都有限公司,未经曙光信息产业股份有限公司;曙光信息产业(北京)有限公司;中科曙光信息产业成都有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011570692.5/2.html,转载请声明来源钻瓜专利网。