[发明专利]面向空气污染物的自相关误差Informer模型长时序预测方法及系统有效
申请号: | 202210282721.0 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114662389B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 蔡坤;张旭升;李莘莘;张静;葛强 | 申请(专利权)人: | 河南大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/0464;G06N3/084 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
地址: | 475001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 空气 污染物 相关 误差 informer 模型 时序 预测 方法 系统 | ||
1.一种面向空气污染物的自相关误差Informer模型长时序预测方法,其特征在于,包括:
步骤1:基于自相关误差对Informer模型进行改进,得到AE-Informer模型;所述步骤1包括:
基于KL散度策略对Informer模型的Self-Attention机制进行改进:使用KL散度计算每个query的稀疏得分,选取稀疏得分较高的lnL个query与其他所有key做点积运算,作为注意力得分,剩下的query不再进行Attention运算,而是将输入的value取平均值作为输出;
基于自相关误差策略,将输入序列改变为每一时刻观测值与前一时刻观测值之间的误差;
步骤2:收集各站点的小时空气污染物数据并进行预处理,包括:缺失值补缺,统一编码;
步骤3:对AE-Informer模型进行超参数的调节;
步骤4:基于处理后的各站点的小时空气污染物数据,采用近似求导反向误差传播算法训练AE-Informer模型;
步骤5:对实时收集的各站点小时空气污染物数据进行预处理,之后输入训练好的AE-Informer模型中,进行空气污染物的长时序预测。
2.根据权利要求1所述的面向空气污染物的自相关误差Informer模型长时序预测方法,其特征在于,所述AE-Informer模型的基本组成部分为ProbSpare Self-Attention层、Full Self-Attention层、编码层、卷积层、归一化层和全连接层;其中ProbSpare Self-Attention层是基于KL散度策略改进的Self-Attention机制,Encoder部分的ProbSpareSelf-Attention层用于将输入的时序序列计算相应的权重系数并形成模型的内部序列,Decoder部分的Full Self-Attention层用于将模型的内部序列转换为要预测的目标序列,编码层用于将输入的空气污染物的时序序列编码为新的序列,卷积层用于进行模型蒸馏操作,归一化层为LayerNorm,全连接层用于将模型生成的序列重新变成任务要求的空气污染物的时序序列的长度。
3.根据权利要求1所述的面向空气污染物的自相关误差Informer模型长时序预测方法,其特征在于,所述步骤2还包括:
将缺失的样本量超过总样本量的10%的站点对应的小时空气污染物数据进行删除。
4.根据权利要求1所述的面向空气污染物的自相关误差Informer模型长时序预测方法,其特征在于,所述步骤2中,使用集成模型进行缺失值的补缺。
5.根据权利要求1所述的面向空气污染物的自相关误差Informer模型长时序预测方法,其特征在于,所述步骤2中,统一编码包括:
将位置编码分为三个部分,分别为输入向量、局部时间戳和全局时间戳,假设Xt为t时刻输入的时序序列,p是全局时间戳的类型数,pos代表在时序序列中的位置,Lx为输入模型前的Xt向量的长度,dmodel为输入模型后的向量长度,其中
局部时间戳使用位置编码的计算公式为:
其中PE(pos,2j)表示局部时间戳,即当前参数在整个序列当中的位置;
全局时间戳使用可学习嵌入表示SE(pos)实现,首先构建一个词汇表,使用Embedding层表示每一个词汇,然后使用Conv1d将输入标量转为向量最终的计算公式为:
其中α是平衡标量投影和局部/全局嵌入之间大小的因子,α=1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210282721.0/1.html,转载请声明来源钻瓜专利网。