[发明专利]一种知识本体构建方法、终端设备及存储介质有效
申请号: | 202011549374.0 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112699248B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 傅金争;袁泉;王电;乔盛 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F40/211;G06F40/284;G06F40/289;G06Q50/26;G06N5/04 |
代理公司: | 厦门市精诚新创知识产权代理有限公司 35218 | 代理人: | 何家富 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 本体 构建 方法 终端设备 存储 介质 | ||
1.一种知识本体构建方法,其特征在于,包括以下步骤:
S1:构建知识本体,并配置本体对应的元数据;
S2:根据构建的知识本体和配置的元数据,采集对应的实体数据并存入知识库内;
S3:构建规则库;规则库根据案案关系、人案关系、人人关系、同事件关系、同线索关系、同群体关系对知识库扩展以及知识多元化产生;
S4:加载实例并根据配置的元数据和规则库内的规则,从实例中提取实例数据,实例数据包括知识实例、结构化数据、标签数据和非结构化数据;根据提取的知识实例抽取知识节点并添加至知识库内;根据配置的元数据将添加至知识库内的知识节点与知识库内原有的实体数据对应的节点进行映射;根据提取的非结构化数据通过依存句法分析进行三元组抽取,将抽取的三元组数据添加至知识库内;
将知识节点添加至知识库内是通过执行指定节点CSV文件的neo4j import脚本进行,节点CSV文件的数据格式从左到右分别为命名标识、属性信息和标签信息三个部分;
将添加至知识库内的知识节点与知识库内原有的实体数据对应的节点进行映射是通过执行指定关系CSV文件的neo4j import脚本进行,关系CSV文件的数据格式包括:关系起始节点、关系终止节点、关系属性信息及关系类型;
对提取的非结构化数据进行依存句法分析之前,还包括对提取的非结构化数据进行预处理,对预处理后的数据进行实体抽取,对抽取的实体进行依存句法分析进而抽取三元组数据;预处理包括分词处理;分词处理采用开源分词工具包进行分词后,通过对应领域的领域词库进行分词训练,使得分词后的词汇能够与领域词库中的词汇相匹配;
S5:根据提取的结构化数据和抽取的三元组数据构建新的规则并更新至规则库内;
S6:根据知识库生成知识图谱。
2.根据权利要求1所述的知识本体构建方法,其特征在于:步骤S1中元数据包括:资源信息表、资源信息属性描述表、资源属性与本体以及对象属性对照映射表、实例资源关联表和资源信息与本体关联表。
3.根据权利要求1所述的知识本体构建方法,其特征在于:规则库包括推理规则、实体消歧规则和非结构化数据三元组提取规则。
4.一种知识本体构建终端设备,其特征在于:包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~3中任一所述方法的步骤。
5.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1~3中任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011549374.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种六联动抛光方法
- 下一篇:铜排修饰加工用多面抛光机