[发明专利]一种基于双LSTM迭代学习的物联网数据流检测方法有效
| 申请号: | 202010697024.2 | 申请日: | 2020-07-20 |
| 公开(公告)号: | CN111866128B | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 任条娟;陈友荣;王章权;刘半藤;苏子漪;孙萍 | 申请(专利权)人: | 浙江树人学院(浙江树人大学) |
| 主分类号: | H04L67/12 | 分类号: | H04L67/12;H04L43/0876;G06N3/08;G06N3/04 |
| 代理公司: | 绍兴市寅越专利代理事务所(普通合伙) 33285 | 代理人: | 邓爱民 |
| 地址: | 312303 浙江省绍*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 lstm 学习 联网 数据流 检测 方法 | ||
1.一种基于双LSTM迭代学习的物联网数据流检测方法,其特征在于:内容包括:
步骤1:获取非异常数据流信息后进行向量化处理,得到数据向量;
步骤2:构建训练样本;
步骤3:构建结构相同的主LSTM模型和从LSTM模型,将训练样本输入从LSTM模型进行训练,从LSTM模型输出的模型参数传至主LSTM模型中,主LSTM模型负责数据流的检测;
步骤4:主LSTM模型从需要检测的数据流中获取数据,并判断是否出现扩展设备:若无扩展设备,则对获取数据进行向量化处理,得到数据向量δ0;若有扩展设备,则对获取数据进行向量化处理得到数据向量δ′0,数据向量δ′0含未扩展设备时的数据向量δ0以及扩展设备的数据向量σED,先屏蔽扩展设备数据向量σED,得到与扩展前长度一致的数据向量δ0;
步骤5:将数据向量δ0拆分成M段长度相等的向量片段,构建M组衍生向量,衍生向量生成方式为:每次任意取M-1段向量片段,按照原划分位置关系排列,位置空缺处填入训练数据同位置的均值;
步骤6:将M组衍生向量及数据向量δ0输入主LSTM模型中,主LSTM模型输出M+1个包括预测类型prei及预测类型对应的概率值Pi的子结果;计算细分事件的阈值概率若则输出预测类型prei,若则判断为异常事件无需进行细分;统计M+1个结果中出现次数最高的预测值作为最终的判断结果值preresult,并输出数据流的检测结果;
步骤7:将数据向量δ0和判断结果值preresult,或者将数据向量δ′0和判断结果值preresult组合形成新的训练样本,将新训练样本投入从LSTM模型中进行训练,训练后的更新参数传至主LSTM模型中。
2.根据权利要求1所述的一种基于双LSTM迭代学习的物联网数据流检测方法,其特征在于:所述步骤2中的训练样本是将非异常行为进行细分,按照X=(x1,x2,…,xn)进行标记,其中xi表示第i种细分事件对应的事件发生数,i=1,2,…,n。
3.根据权利要求2所述的一种基于双LSTM迭代学习的物联网数据流检测方法,其特征在于:所述步骤5中将数据向量拆分成10段,得到10组衍生向量δ1,δ2,…δ10;步骤6中主LSTM模型输出的子结果表示为results=(pre0,P0),(pre1,P1),…(pre10,P10),细分事件的阈值概率计算公式如下:
其中,表示细分事件的平均事件数,表示基于统计的异常事件概率换算至训练样本中的事件数,α为异常概率,表示细分事件数对阈值概率的影响,
4.根据权利要求3所述的一种基于双LSTM迭代学习的物联网数据流检测方法,其特征在于:所述步骤7中先进行是否有新扩展设备的判断,若没有扩展设备,则将数据向量δ0和判断结果值preresult组合形成新的训练样本;若有新扩展设备,则将数据向量δ′0和判断结果值preresult组合形成新的训练样本,并记录扩展训练样本容量N;判断扩展训练样本容量N是否大于原有训练样本容量X,若大于则表明设备扩展已完成,不再认为此时有新设备接入,且将原训练样本容量更新为N;若不大于,则表明设备扩展未完成,继续认为此时有新设备接入,继续执行步骤4。
5.根据权利要求1所述的一种基于双LSTM迭代学习的物联网数据流检测方法,其特征在于:所述向量化处理内容如下:
1)网络初始化,获取传感器节点的数据;
2)判断是否为开关型数据,若“是”则将开启信号或高电平设置为1,将关闭信号或者低电平设置为0;若“否”则执行步骤3);
3)判断是否为脉冲型数据,若“是”则记录脉冲信号并换算成具体数字型数据;若“否”则执行步骤4);
4)判断是否为数字型数据,若“是”则直接记录数字型数据,若“否”则执行步骤5);
5)判断是否为模拟量型数据,若“是”则利用公式进行归一化计算,其中dmax和dmin为可预见的数值的最大、最小值,d为当前记录的模拟量数据,dnor为进行归一化后的模拟量数据;若“否”则认为数据类型出现错误,报告错误信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江树人学院(浙江树人大学),未经浙江树人学院(浙江树人大学)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010697024.2/1.html,转载请声明来源钻瓜专利网。





