[发明专利]一种面向智慧电厂的安全知识图谱构建方法及系统有效

专利信息
申请号: 202110683084.3 申请日: 2021-06-21
公开(公告)号: CN113254594B 公开(公告)日: 2022-01-14
发明(设计)人: 祝敬伟;郭峰;何立军;周亚明;芮文君;陈国祥;党明锐;顾舒;吉云 申请(专利权)人: 国能信控互联技术有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/36;G06F40/211;G06F40/216;G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08;G06Q50/06
代理公司: 北京智绘未来专利代理事务所(普通合伙) 11689 代理人: 肖继军;王萍
地址: 102211 北京市昌平区未来科*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 智慧 电厂 安全 知识 图谱 构建 方法 系统
【权利要求书】:

1.一种面向智慧电厂的安全知识图谱构建方法,其特征在于,所述构建方法包括以下步骤:

步骤1:采集包含人员信息的原始文本数据以及包含区域作业的原始文本数据;

步骤2:构建反映多实体关系的知识模型;

步骤3:依据步骤2构建的知识模型,对步骤1采集的文本数据进行分类、清洗得到结构化与半结构化数据并将它们存入多种数据源;

步骤4:从步骤3的多种数据源提取所储存的半结构化数据并从中进行知识抽取;

知识抽取包括实体抽取、关系抽取和属性抽取;

所述实体抽取是从半结构化数据中提取原子信息元素,其包括员工姓名、部门名称、岗位名称、区域名称以及区域地理位置;一个原子信息元素即为一个实体;

实体抽取方法包括以下内容:

步骤401.1:从多种数据源中随机选取部分半结构化数据并使用jieba对原始文本进行标注,得到带有词性的字符序列;

步骤401.2:将带有词性的字符序列作为分词模型的训练输入,分词模型输入数据的字符序列为,其对应的状态序列为,即分词模型所要区分的词性类型;分词模型如下:

其中:为字符序列以及状态序列的条件概率,为特征函数,表示特征函数的总数,特征函数取值方法有两种:将字符序列与状态序列中的每一个词性进行比对,如果符合状态序列中的词性,则对应该状态序列位置上的为1,否则为0;为特征函数的权重参数;为文本当前的输出状态,为上一步输出状态;为当前的输入序列;

为全局归一化因子,其计算方法为:

当条件概率最大时,分词模型训练结束;

步骤401.3:将剩余的半结构化数据输入训练好的分词模型,得到分词后使用维特比算法进行序列标注得到实体信息;

所述关系抽取是采用基于监督学习的方法从半结构化数据中抽取出两个或者多个实体之间的语义关系;

所述属性抽取是指从半结构化数据中采集特定实体的属性信息;

步骤5:通过步骤4得到的知识抽取数据以及步骤3的结构化数据构建人员知识图谱与区域作业知识图谱并进行存储;

步骤6:将步骤5得到的人员知识图谱以及区域作业知识图谱运用于不同应用场景之中。

2.根据权利要求1所述的安全知识图谱构建方法,其特征在于:

在所述步骤1中,所述人员信息的原始文本数据包括含有员工id、员工姓名、员工出生日期、员工学历、员工岗位、员工联系方式、员工所属部门、员工所属岗位、员工所属区域、员工状态的文本以及员工区域安全权限等级;

区域作业的原始文本数据包括含有区域信息、部门信息、岗位信息、设备信息、高风险作业信息、隐患记录信息、违章记录信息以及安全检查任务信息的文本;

区域信息包括区域id、区域编码、区域名称、区域状态、区域责任部门、区域负责人、区域负责人联系电话、区域创建部门、上级区域名称、风险等级以及区域描述的文本;

部门信息包括部门id、部门名称、部门人数、部门责任人、部门电话以及部门地址的文本;

岗位信息包括岗位id、岗位名称、岗位人数、岗位所属部门、岗位职责、岗位资格证、岗位学历以及岗位专业的文本;

设备信息包括设备id、设备名称、设备购买日期、设备使用年限以及设备负责人的文本;

高风险作业信息包括高风险作业id、高风险作业起止时间、高风险作业所属部门、高风险作业状态、高风险作业种类、高风险作业参与人数以及高风险作业参与人名的文本;

隐患记录信息包括针对该区域作业产生的隐患id、隐患名称、隐患类型、隐患发现时间、隐患解决时间、隐患负责部门以及隐患负责人的文本;

违章记录信息包括违章id、违章人员姓名、违章内容、违章时间、违章类型、违章负责部门以及违章负责人的文本;

安全检查任务信息包括安全检查任务id、安全检查人员姓名、安全检查任务内容、安全检查任务等级、安全检查任务状态以及安全检查完成时间的文本。

3.根据权利要求1或2所述的安全知识图谱构建方法,其特征在于:

在所述步骤2中,所述知识模型由实体与实体间的关系,即语义关系构成;

所述实体包括区域实体、人员实体、部门实体、岗位实体、设备实体、高风险作业实体、隐患记录实体、违章记录实体和安全检查任务实体;

所述实体关系为各类实体间的关联关系,包括所属关系、授权关系、负责关系与参与关系。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国能信控互联技术有限公司,未经国能信控互联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110683084.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top