[发明专利]基于深度神经网络的设备量测数据处理方法、系统及终端有效
申请号: | 202110885209.0 | 申请日: | 2021-08-03 |
公开(公告)号: | CN113326380B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 罗玮;刘金全;杨庚鑫;许剑 | 申请(专利权)人: | 国能大渡河大数据服务有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/295;G06F40/30;G06N3/04 |
代理公司: | 成都启慧金舟知识产权代理事务所(特殊普通合伙) 51299 | 代理人: | 何媛;冯龙 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 设备 数据处理 方法 系统 终端 | ||
1.基于深度神经网络的设备量测数据处理方法,其特征是,包括以下步骤:
通过基于双向长短期记忆神经网络和条件随机场建立的识别模型对目标设备量测数据进行实体识别,得到以标签标注后用字符向量和词向量共同表示的短文本序列;通过预构建的词典对目标设备量测数据进行分词,并采用cw2vec模型以提取中文笔画n-gram特征的方式对分词得到的词进行预训练,得到由笔画信息的词嵌入向量组成的词向量序列;
将短文本序列扩充后输入卷积神经网络,通过学习短文本中的深度特征得到短文本深层语义,并依据短文本深层语义进行聚类处理后得到聚类设备量测数据;
通过预构建的训练模型训练得到历史设备量测数据与标准编码之间的映射关系,并将聚类设备量测数据输入训练模型后结合映射关系得到新量测数据预测编码标签。
2.根据权利要求1所述的基于深度神经网络的设备量测数据处理方法,其特征是,所述识别模型包括输入层、双向长短期记忆网络层、向量表示层、注意力层、条件随机场层;
输入层,用于采用word2vec模型对输入的字符进行预训练后得到字符嵌入序列;
双向长短期记忆网络层,用于将字符嵌入序列作为双向长短期记忆网络各个时间步的输入,并将正向长短期记忆网络输出的状态序列和反向长短期记忆网络在各个位置输出的状态序列进行拼接,得到由字符向量组成的字符向量序列;
向量表示层,用于通过预构建的词典对目标设备量测数据进行分词,并采用cw2vec模型以提取中文笔画n-gram特征的方式对分词得到的词进行预训练,得到由笔画信息的词嵌入向量组成的词向量序列;
注意力层,用于将词嵌入向量与相应的字符向量进行关注计算,并通过注意力机制模型动态决定笔画信息的使用信息量以获得词对预测目标的贡献矩阵,以及将词向量序列、字符向量序列融合得到的输出矩阵与贡献矩阵拼接后得到量测数据序列;
条件随机场层,用于采用条件随机场对量测数据序列进行标注,并以过去的标签和将来的标签来预测当前的标签,得到标签标注后的短文本序列。
3.根据权利要求1所述的基于深度神经网络的设备量测数据处理方法,其特征是,所述聚类设备量测数据的获得过程具体为:
利用行业标准术语库扩充短文本序列中的短文本数据;
采用word2vec模型对扩充后的文本数据进行训练,得到以字符向量进行文本表示的扩充后的短文本序列;
将扩充后的短文本序列输入卷积神经网络学习短文本中的深度特征,得到短文本深层语义;
采用k-means算法依据短文本深层语义进行聚类处理后得到聚类设备量测数据。
4.根据权利要求1所述的基于深度神经网络的设备量测数据处理方法,其特征是,所述新量测数据预测编码标签的获得过程具体为:
获取历史设备量测数据与标准编码,并对历史设备量测数据进行数据清洗以过滤冗余数据;
提取清洗后的历史设备量测数据中的词嵌入特征,并以词嵌入特征和标准编码组成训练集后输入到训练模型,训练得到历史设备量测数据与标准编码之间的映射关系;
提取目标设备量测数据中的词嵌入特征,并将词嵌入特征输入到训练模型后结合映射关系训练得到新量测数据预测编码标签。
5.根据权利要求4所述的基于深度神经网络的设备量测数据处理方法,其特征是,所述训练模型为卷积神经网络模型,包括:
卷积层,用于将以词嵌入特征构成表示诊断描述的词向量矩阵进行卷积产生窗口生成特征;词向量矩阵的维度为n*d;n表示每个设备量测数据描述含有词的个数;d表示每个词的词向量维数;
池化层,用于对窗口生成特征降维处理后得到保留最重要特征的简化特征;
全连接层,用于依据简化特征输出新量测数据预测编码标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国能大渡河大数据服务有限公司,未经国能大渡河大数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110885209.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:虚拟机创建方法及装置
- 下一篇:曲面指纹传感器的增益补偿检测方法及终端设备