[发明专利]基于油气管道的知识图谱构建方法及处理器在审
申请号: | 202111578731.0 | 申请日: | 2021-12-22 |
公开(公告)号: | CN114428862A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 赵明华;吴张中;李莉;张斌;李秋扬;温文;杨瑞 | 申请(专利权)人: | 国家石油天然气管网集团有限公司;国家管网集团北方管道有限责任公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 陈姝婧 |
地址: | 100013 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 油气 管道 知识 图谱 构建 方法 处理器 | ||
1.一种基于油气管道的知识图谱构建方法,其特征在于,包括:
获取所述油气管道所在领域的文本数据;
对所述文本数据进行预处理,并对预处理后的文本数据进行标注,以构建所述油气管道的标注数据语料库;
将所述标注数据语料库包含的语句输入至实体识别学习模型,以通过所述实体识别学习模型提取所述语句中包含的实体;
将所述实体输入至实体关系抽取模型中,以通过所述实体关系抽取模型确定所述实体之间的实体关系;
根据所述实体和所述实体关系构建基于所述油气管道的知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在获取所述油气管道所在领域的文本数据之前,构建基于所述油气管道全生命周期业务的领域本体;
根据所述领域本体对所述预处理后的文本数据进行标注。
3.根据权利要求2所述的方法,其特征在于,所述构建基于所述油气管道全生命周期业务的领域本体包括:
构建油气管道领域的资源库,所述资源库包括所述油气管道领域内的多个词汇、术语和规则模板中的至少一者;
按照油气管道全生命周期的各个阶段对所述资源库中的数据进行归纳和整理,以构建基础文本集;
根据油气管道业务内容和特点,对所述基础文本集中的资源进行分类;
对所述基础文本集中的资源进行分词,确定每个分类下所包括的词语,以得到基础词库;
根据预设的油气管道领域的语义类型及语义关系集,对所述基础词库包含的词语进行标注,以构建油气管道的基础语义概念集。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
使用MySQL存储用户信息、所述知识图谱的图谱信息以及所述领域本体的数据;
使用MongoDB存储所述实体和所述实体关系;
使用图数据库Neo4j存储所述知识图谱的图结构;
使用ElasticSearch存储文本索引数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括对所述实体关系抽取模型训练的步骤,包括:
获取多个所述油气管道所在领域的文本数据作为样本数据;
对所述样本数据进行预处理;
将预处理后的样本数据输入至所述实体关系抽取模型;
通过所述实体关系抽取模型对输入的样本数据包含的语句进行分割,以得到每个语句的多个分词以及每个分词的词特征和词的类型特征向量;
将所述词特征和所述词的类型特征向量进行拼接融合,以得到每个语句的词嵌入表示;
将每个语句的词嵌入表示作为所述实体关系抽取模型的卷积层的输入数据,并获取所述卷积层输出的每个语句的局部特征;
将每个语句的局部特征作为所述实体关系抽取模型的池化层的输入数据,通过所述池化层确定每个语句的全局特征;
对所述全局特征进行分类,并将分类后的全局特征作为所述实体关系抽取模型的全连接层的输入数据;
获取所述全连接层输出的针对每对实体的预测实体关系;
根据预先标注的实体关系与所述预测实体关系确定所述实体关系抽取模型的预测准确率;
在所述预测准确率达到预设阈值的情况下,确定所述实体关系抽取模型训练完毕。
6.根据权利要求1所述的方法,其特征在于,所述文本数据包括以下数据中的至少一者:
所述油气管道领域的管理系统、生产系统、科研管理系统以及标准查询系统的至少一者中所包含的业务数据;
外部系统中包含的所述油气管道领域内的期刊和文献数据;
网页中所包括的所述油气管道领域内的数据。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述实体识别学习模型为双向长短时期记忆网络,所述实体关系抽取模型为CNN神经网络。
8.一种处理器,其特征在于,被配置成执行根据权利要求1至7中任意一项所述的基于油气管道的知识图谱构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家石油天然气管网集团有限公司;国家管网集团北方管道有限责任公司,未经国家石油天然气管网集团有限公司;国家管网集团北方管道有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111578731.0/1.html,转载请声明来源钻瓜专利网。