[发明专利]一种知识本体构建方法、终端设备及存储介质有效

专利信息
申请号: 202011549374.0 申请日: 2020-12-24
公开(公告)号: CN112699248B 公开(公告)日: 2022-09-16
发明(设计)人: 傅金争;袁泉;王电;乔盛 申请(专利权)人: 厦门市美亚柏科信息股份有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/31;G06F40/211;G06F40/284;G06F40/289;G06Q50/26;G06N5/04
代理公司: 厦门市精诚新创知识产权代理有限公司 35218 代理人: 何家富
地址: 361000 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 知识 本体 构建 方法 终端设备 存储 介质
【说明书】:

发明涉及一种知识本体构建方法、终端设备及存储介质,该方法中包括:S1:构建知识本体,并配置本体对应的元数据;S2:根据构建的知识本体和配置的元数据,采集对应的实体数据并存入知识库内;S3:构建规则库;S4:加载实例并根据配置的元数据和规则库内的规则,从实例中提取实例数据;根据实例数据抽取知识节点和三元组数据并添加至知识图库内;S5:根据提取的结构化数据和抽取的三元组数据构建新的规则并更新至规则库内;S6:根据知识库生成知识图谱。本发明分别利用实例数据的结构化数据以及非结构化数据为基础进行语义化分析,通过元数据对本体的描述以及构建规则库的方式驱动知识数据,构建知识图谱。

技术领域

本发明涉及知识图谱构建领域,尤其涉及一种知识本体构建方法、终端设备及存储介质。

背景技术

随着网络普及以及客户对业务理解的逐渐加深,信息化系统也被大量的应用,使得数据之间的互通性、扩展性得到提升,一定程度上提升了办公效率。但是在大量的法律案本信息面前,业务人员如何能够快速的解决定位问题成为迫切需要解决的问题。

以往的方案都是通过客户或者业务人员的经验来解决问题,但也是由于人员的流动导致执行人员业务经验参差不齐,办案效果不能向预期的方向发展,而分析目前也停留在查询,统计的简单应用,不能够将数据的价值发挥完全。

发明内容

为了解决上述问题,本发明提出了一种知识本体构建方法、终端设备及存储介质。

具体方案如下:

一种知识本体构建方法,包括以下步骤:

S1:构建知识本体,并配置本体对应的元数据;

S2:根据构建的知识本体和配置的元数据,采集对应的实体数据并存入知识库内;

S3:构建规则库;

S4:加载实例并根据配置的元数据和规则库内的规则,从实例中提取实例数据,实例数据包括知识实例、结构化数据、标签数据和非结构化数据;根据提取的知识实例抽取知识节点并添加至知识库内;根据配置的元数据将添加至知识库内的知识节点与知识库内原有的实体数据对应的节点进行映射;根据提取的非结构化数据通过依存句法分析进行三元组抽取,将抽取的三元组数据添加至知识图库内;

S5:根据提取的结构化数据和抽取的三元组数据构建新的规则并更新至规则库内;

S6:根据知识库生成知识图谱。

进一步的,步骤S1中元数据包括:资源信息表、资源信息属性描述表、资源属性与本体以及对象属性对照映射表、实例资源关联表和资源信息与本体关联表。

进一步的,规则库包括推理规则、实体消歧规则和非结构化数据三元组提取规则。

进一步的,将知识节点添加至知识库内通过执行指定节点CSV文件的neo4jimport脚本进行,节点CSV文件的数据格式从左到右分别为命名标识、属性信息和标签信息三个部分。

进一步的,将添加至知识库内的知识节点与知识库内原有的实体数据对应的节点进行映射通过执行指定关系CSV文件的neo4j import脚本进行,关系CSV文件的数据格式包括:关系起始节点、关系终止节点、关系属性信息及关系类型。

进一步的,步骤S4中对提取的非结构化数据进行依存句法分析之前,还包括对提取的非结构化数据进行预处理,对预处理后的数据进行实体抽取,对抽取的实体进行依存句法分析进而抽取三元组数据。

进一步的,预处理包括分词处理;分词处理采用开源分词工具包进行分词后,通过对应领域的领域词库进行分词训练,使得分词后的词汇能够与领域词库中的词汇相匹配。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011549374.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top