[发明专利]一种用于实时污染数据预测的训练模型在审
申请号: | 202310202365.1 | 申请日: | 2023-03-06 |
公开(公告)号: | CN116187389A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 黄欣逸;张伟;揭小丽;刘卫杰;付瑶;曾旭明 | 申请(专利权)人: | 成都之维安科技股份有限公司 |
主分类号: | G06N3/0442 | 分类号: | G06N3/0442;G06N3/0985;G06N3/084;G06F18/15;G06F18/10;G06Q10/04;G06Q50/26 |
代理公司: | 成都立新致创知识产权代理事务所(特殊普通合伙) 51277 | 代理人: | 刘俊 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 实时 污染 数据 预测 训练 模型 | ||
1.一种用于实时污染数据预测的训练模型,其特征在于:包括以下步骤:
S1、创建用于完成多因子污染物排放预测的主模型meta-model,初始化主模型meta-model中kernel参数;主模型中,可训练参数记作θ;
S2、数据分组
在数据预处理过程中,需要预先对数据进行清洗,即检测并擦除异常数据;
采用拉格朗日多项式插值法补全数据;
将补全后的数据分按比例分为训练组、测试组,又将训练组中数据按比例分为supportdata、query data,分别记作Ds,Dq;
S3、考虑因子间的关联关系,同时处理多维因子;
现对多维污染因子进行处理:
S31、先获取数据:将训练组的support data与query data等比划分成n份;将第l个任务中(l=1……n,n表示有n个任务)进行预测所需的数据,分别记作Dsl,Dql;
S32、a、向主模型meta-model中输入数据Dsl,输入模型,前向传递,计算得到预测值
再取出步骤S2中实际测得的样本真实值;
b、计算预测值与样本真实值的均方误差(MeanSquaredError),公式如下:
其中,k表示污染因子维数,为任务l中污染因子第i维的真实值,为任务l中模型预测的第i维值;
样本真实值为实际测得的值;
c、为提高模型泛化能力,对模型权重参数采用L2正则化处理,L2正则误差公式如下:
其中,其中λ为衰减系数,wi为模型中的第i个权重参数;
误差总公式合并为:
将该公式计算得出的误差记作
d、根据Dsl输入主模型meta-model得出的推理结果与样本真实值之间的误差,以链式法则反向传递,计算梯度
其中,yl代表任务l的污染因子真实值;
e、根据先前的可训练参数θ、计算出的梯度以及学习率α,手动计算出优化后的模型参数θ',
其中,学习率α为经验值,即α的数值是根据经验来确定的;
S4、建立子模型sub-model,结构与meta-model一致,用于处理任务中的另一部分输入数据:Dql,子模型sub-model的参数以手动优化后的meta-model模型参数作为其初始化参数;
由于S3是针对第l个任务中的Dsl数据进行的处理,故在S3基础上进一步处理;
S41、构建任务l中的Dql输入数据所对应的子模型sub-model;
该子模型sub-model以θ'作为参数,其余与主模型meta-model相同(主模型meta-model采用θ作为初始化参数);
S42、a、向子模型sub-model输入任务l对应的数据Dql,计算得到预测值
b、计算预测值与相应样本真实值的均方误差;该样本真实值为实际测得的值(如Dql有m个按时间先后顺序排列的数据,选取前m-1个数据输入子模型中计算得到预测值,而第m个数据本身为样本真实值,计算预测值与样本真实值之间的均方误差);
c、为提高子模型sub-model的泛化性,对该子模型权重经L2正则化处理方法进行限定,并与均方误差叠加,记作
d、根据任务量n,循环步骤S32、a~S43、c,得到误差集
e、叠加误差集,得到总误差,记作losstotal;以链式法则反向传递,计算梯度
f、根据参数θ'、计算出的梯度以及学习率β,利用Adam[1]优化器更新meta-model的参数θ:
至此,任务遍历完毕,结束单次迭代;
S5、根据迭代次数iteration number,重复步骤S3~S4,直至完成迭代,输出主模型meta-model。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都之维安科技股份有限公司,未经成都之维安科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310202365.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置