[发明专利]基于知识图谱的智能电厂典型设备故障诊断知识库构建方法有效
| 申请号: | 202011131638.0 | 申请日: | 2020-10-21 |
| 公开(公告)号: | CN112307218B | 公开(公告)日: | 2022-08-05 |
| 发明(设计)人: | 赵健程;朱文欣;高诗宁;赵春晖 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/289;G06F40/216;G06F40/242;G06N3/04;G06N5/02;G06Q50/06 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识 图谱 智能 电厂 典型 设备 故障诊断 知识库 构建 方法 | ||
1.基于知识图谱的智能电厂典型设备故障诊断知识库构建方法,其特征在于,具体步骤如下:
1)收集原始数据;包括含有电厂设备故障诊断知识的文本,带故障诊断标签的故障数据和故障现场图;
2)对多模态数据进行针对性的预处理,将非文本数据转换为文本数据;
3)对文本数据进行处理,构建“双层——三要素”的知识图谱;“双层”指设备层、故障层;设备层基于专家提供、领域术语词典、TF-IDF算法提取出的关键词构建;故障层包括故障诊断的“三要素”:故障描述、故障诊断、处理意见;从而得到了故障诊断知识图谱;
4)对故障描述文本、故障诊断文本、处理意见文本进行进一步处理,构建用于双向GRU网络提取文本特征的训练集;
5)构建并训练基于双向GRU网络、注意力机制的编码器——解码器模型,从编码器输出的状态得到无标签文本的特征向量;冻结训练好的网络参数、并存储获得的特征向量;具体为:采用编码器——解码器框架和注意力机制构建使用GRU的双向循环神经网络;通过每一个子句同时作为源语句和目标语句,自监督获取每一个子句的特征向量;其中GRU具体包括:
首先将每个用于编码器输入端的子句样本中的每个词采用独热编码转换为一维向量,每一个向量的长度和BPE处理得到的词典大小相同,其中只有该词对应的位置为1,其余位置为0;然后使用embedding层进行降维映射,映射矩阵大小为K*V,其中K为设定的词向量维度,V为词典大小;将映射矩阵与子句独热编码形成的矩阵相乘从而对词向量降维,得到词向量组x={x1,x2,...,xt,...,xT},T表示子句中对应的词数量;在模型训练过程中,对于每个字句样本对应的期望输出语句,采用相同的方法进行处理,得到u={u1,u2,...,ut,...,uT};
通过上一刻的状态ht-1和当前节点的输入xt来获取重置门r和更新门z:
r=sigmoid(wr*[ht-1,xt])
z=sigmoid(wz*[ht-1,xt])
其中,x={x1,x2,...,xt,...,xT}为每一个子句样本经过上述独热编码和映射过程得到的词向量组,t即当前时刻,表示当前所输入的词在子句中所处的位置;sigmoid函数将数值映射到0-1范围内;wr、wz均是需要学习的参数;
接着获得当前时刻的状态与输出
其中w为需要学习的参数;
对于编码器部分,双向循环神经网络分别在时间维度上以前向和后向处理输入序列,并将每个时间步的输出拼接作为最终的特征向量输出;
其中xt为独热编码后降维得到的词向量,为非线性激活函数;
对于解码器部分,应用注意力机制,每一个时刻,根据由公式(12)计算出的第t个词的上下文向量ct,目标序列第t个词向量ut和t时刻隐藏状态zt,计算出下一个隐层状态zt+1:
其中权重aij表示目标词i对源词j的注意力大小,align为对齐模型,用于衡量目标词i对源词j的匹配程度;
将zt+1通过softmax归一化,得到目标序列第t+1个词的概率分布pt+1,使用交叉熵函数得到t+1的代价,对所有时刻取平均得到总的损失函数:
pt+1=softmax(wszt+1+b)
其中avg为求平均函数,cross_entropy为交叉熵函数;ws,b为需要学习的参数;冻结训练好的网络参数、并存储获得的特征向量;
6)应用得到的特征向量,结合设备层与领域词典提供的关键术语,将故障现场图、过程数据生成的文本描述与原有文本数据的故障描述进行对齐获得智能电厂典型设备故障诊断知识库;
其中,对于新增故障诊断知识、采用2)、3)、4)的过程进行处理后,如果其中没有出现词典未收录的关键术语,则使用5)中构建训练的网络得到编码结果,使用解码器结合柱搜索算法得到解码结果,解码结果和原子句进行比对,如一致则通过检验,将新知识并入原有知识图谱,实现知识图谱的更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011131638.0/1.html,转载请声明来源钻瓜专利网。





