[发明专利]一种用于实时污染数据预测的训练模型在审
申请号: | 202310202365.1 | 申请日: | 2023-03-06 |
公开(公告)号: | CN116187389A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 黄欣逸;张伟;揭小丽;刘卫杰;付瑶;曾旭明 | 申请(专利权)人: | 成都之维安科技股份有限公司 |
主分类号: | G06N3/0442 | 分类号: | G06N3/0442;G06N3/0985;G06N3/084;G06F18/15;G06F18/10;G06Q10/04;G06Q50/26 |
代理公司: | 成都立新致创知识产权代理事务所(特殊普通合伙) 51277 | 代理人: | 刘俊 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 实时 污染 数据 预测 训练 模型 | ||
发明涉及一种用于实时污染数据预测的训练模型,其以LSTM作为基础模型,通过MAML加快LSTM收敛速度,减少LSTM模型数据集方面的限制。本发明达到的有益效果是:突破污染因子数据集数据量不够的限制,同时能够实现单一因子预测目标与多目标预测的平衡;该模型能够实现在保持预测准确度不降低的情况下,加速预测模型训练的作用;模型体量轻,在小样本数据集训练上的训练结果泛化性强。
技术领域
本发明涉及污染数据预测技术领域,特别是一种用于实时污染数据预测的训练模型。
背景技术
工业发展带来的大气污染排放量增加一直一来备受关注,治污降霾作为生态保护长期目标,实现从人工管理到数字管理不断发展,实现实时污染数据预测。
传统的污染数据实时预测的模型,是建立在特征互相独立的海量数据基础之上的。然而在实际生活中,污染因子时序数据的特征并非完全独立,由于我国数字化污染物检测起步较晚,导致的可获取有效环保数据十分有限。如何基于有限的环保数据,实现较高精度的预测,一直是一个难题。
本公司,提出基于LSTM的MAML深度学习训练模型结构,该模型体量轻,在小样本数据集训练上的训练结构泛化性强。
发明内容
本发明的目的在于克服现有技术的缺点,提供一种用于实时污染数据预测的训练模型,解决了需要大样本才能精确预测的问题。
需要说明的是,污染因子的预测属于时序数据预测,时序数据预测的长短期记忆网络(Long-short Term Memory Network,LSTM)一定程度上解决了循环神经网络(Recurrent Neural Network,RNN)在多次卷积后出现的梯度消失以及梯度爆炸问题。LSTM利用输入门、遗忘门、输出门进行信息保留丢弃的筛选,通过隐藏状态的计算过程替换RNN的卷积过程。在环保领域中,该模型在数据集丰富的单一时序数据预测任务重该模型表现良好,但是在多任务中对于时序污染物的预测存在预测数据偏差较大的情况。(原因是,RNN是一类以序列数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络;由于RNN必须recursion地去预测,当预测的序列过长,就会出现梯度消失、梯度爆炸的问题)
需要说明的是,实验证明元学习(Model-Agnostic Meta-Learning,MAML)在小样本学习中具有明显优势。MAML以主模型为基础,为不同子任务建立与任务对应的子模型。优化后的子模型的共同作用更新主模型,以获得令子任务共同达到最优解的主模型。
为此,本发明将LSTM模型+MAML模型进行一定结合,设计出新的MAML-LSTM模型;MAML以LSTM作为基础模型(主模型),通过MAML加快LSTM收敛速度,减少LSTM模型数据集方面的限制。即以MAML对LSTM进行简化、优化。
通俗地说,LSTM有4个计算的过程,网络比较复杂;在LSTM中,是一步一步预测的,例如这一时刻预测了时刻为0的数据,下一时刻只能预测时刻为1的数据……而MAML简化了网络中参数的传导。
本发明的目的通过以下技术方案来实现:一种用于实时污染数据预测的训练模型,包括以下步骤:
S1、创建用于完成多因子污染物排放预测的主模型meta-model,初始化主模型meta-model中kernel参数;主模型中,可训练参数记作θ;
S2、数据分组
在数据预处理过程中,需要预先对数据进行清洗,即检测并擦除异常数据;
采用拉格朗日多项式插值法补全数据;
将补全后的数据分按比例分为训练组、测试组,又将训练组中数据按比例分为support data、query data,分别记作Ds,Dq;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都之维安科技股份有限公司,未经成都之维安科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310202365.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置