[发明专利]一种用于安全的工业大数据分析的信息指纹提取方法有效
申请号: | 202110765362.X | 申请日: | 2021-07-07 |
公开(公告)号: | CN113361648B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 葛志强;江肖禹 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 贾玉霞 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 安全 工业 数据 分析 信息 指纹 提取 方法 | ||
本发明公开一种用于安全的工业大数据分析的信息指纹提取方法,该方法首先构建一个信息指纹提取网络,该网络包括孪生神经网络和自编码器,其中孪生神经网络包括两个隐含层参数共享的神经网络;通过有监督对比训练孪生神经网络,把孪生神经网络的隐含层参数保留,并迁移到一个自编码器的编码网络中作为初始化的参数,然后再用原始样本对自编码器进行无监督的训练,得到训练后的自编码器,最后根据训练后的自编码器得到样本的重构样本,再将重构样本与原始样本求差,即可得到信息指纹。该方法定位了真实样本和对抗样本的关键信息,将其进行区分,有效地保护了工业数据驱动模型决策的安全性。
技术领域
本发明属于工业对抗样本的检测领域,具体涉及一种用于安全的工业大数据分析的信息指纹提取方法。
背景技术
随着信息技术、分布式控制系统、传感技术等的不断发展,数据在工业中的积累量已经到了一个前所未有的水平。在工业大数据时代中,相比机理和知识驱动模型,数据驱动模型由于它的灵活性和通用性在工业生产过程中得到了更广泛的应用和发展,最常用的有故障诊模型和软测量模型。但是随着工业控制系统和互联网不断融合,攻击者可以通过多种渠道对系统数据进行篡改,这对数据驱动模型也造成了巨大的风险。
对抗攻击是一种在原有样本的基础上加入少量扰动得到对抗样本,以使数据驱动模型做出错误判断的数据攻击行为。虽然自然扰动在工业场景下是普遍存在的,比如环境噪声,设备老化,操作差异等等。但已有大量的研究证明,数据驱动模型在面对对抗样本时是脆弱的,如果没有良好的应对措施,错误的决策会对工业过程产生重大的安全威胁。
目前迫切的需要一种方法来对工业数据进行检测,判断其是真实样本还是对抗样本,防止对抗样本对数据驱动模型的决策产生误导,进行安全的工业大数据分析。
发明内容
针对对抗样本的检测问题,本发明提出一种用于安全的工业大数据分析的信息指纹提取方法,该方法从真实样本和对抗样本的细微差别中得到代表其各自身份的信息指纹,从而可以适用于不同的工业数据驱动模型,比如故障诊断模型和软测量模型,并以此对对抗样本进行精确的检测。
本发明的目的通过如下的技术方案来实现:
一种用于安全的工业大数据分析的信息指纹提取方法,该方法包括如下步骤:
(1)构建信息指纹提取网络,该网络包括孪生神经网络和自编码器;所述孪生神经网络包括两个隐含层参数共享的神经网络;自编码器包括编码器和解码器两部分结构;
(2)将原始样本和其对应的标签输入孪生神经网络的其中一个神经网络,将原始样本的正样本x+μ和其对应标签输入孪生神经网络的其中一个神经网络,进行有监督训练;其中,n代表的是样本的数量,d是样本的维度,μ~N(0,σ2)为外部噪声的模拟;其中,所述孪生神经网络的损失函数为L+λLcl,其中,L为输入原始样本的神经网络的目标损失函数,λ是权重因子,Lcl为对比训练损失,计算公式如下
其中,h1和h2分别为孪生神经网络的两个神经网络的隐含层的输出;
(3)将孪生神经网络的隐含层参数保留,并迁移到一个自编码器的编码网络中作为初始化的参数,然后用原始样本来对自编码器进行无监督的训练,得到训练后的自编码器;
(4)将待获取信息指纹的样本输入训练后的自编码器,得到该样本的重构样本,重构样本和待获取指纹样本的残差值即为样本的信息指纹。
进一步地,当该方法用于故障诊断任务时,所述孪生神经网络的目标损失函数L采用交叉熵损失函数表示:
其中,i=1,2,…,n,fDNN(·)表示数据驱动模型的预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110765362.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置