[发明专利]基于多任务深度学习神经网络的太阳风速度预测方法在审
申请号: | 202111674519.4 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114492171A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 谢宗霞;毛凯舟;孙彦茹 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李丽萍 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 深度 学习 神经网络 太阳风 速度 预测 方法 | ||
本发明公开了一种基于多任务深度学习神经网络的太阳风速度预测方法,所用的模型包括一个由一维卷积神经网络CNN和一个长短时记忆神经网络LSTM组成的共享模块,一个主LSTM模块以及一个自回归层AR模块。共享模块用于提取多个任务共用的浅层空间和时间特征,主LSTM模块用于单独提取主任务的特性,自回归模块用于以一种线性的方式对神经网络模型进行适当的修正。采用多任务学习机制来实现多步预测,构建模型。在太阳风速度预测领域,引入多任务学习的机制是一种新的尝试。本发明的优点是,联合多个独立的预测任务来同时并行学习,充分利用数据信息,共享公共信息来帮助改进浅层特征提取,并为主要任务设计独立的结构来提高预测性能。
技术领域
本发明属于神经网络模型设计技术领域和太阳风速度预测领域,特别涉及一种基于多任务深度学习的太阳风速度预测模型及其建模方法。
背景技术
目前,在太阳风速度预测领域的三大类方法分别是:(1)基于物理的预测模型,根据太阳物理参数构建物理模型;(2)经验或半经验模型,根据人工观测和专家的经验知识对太阳的状态进行判断;(3)机器学习模型,采用SVM,人工神经网络等输入数据进行训练后进行预测。随着观测数据日益丰富,以及太阳活动的复杂性和灾害性、太阳风速度预报时效性的迫切需求,人们需要开发不同于传统物理模型与经验模型的预测方法。机器学习方法正是能够顺应新的需求的一种技术手段。其中,人工神经网络(Artificial Neural Network,ANN)是20世纪80年代以来机器学习领域的研究热点。近年来,深度学习作为一种重要的人工神经网络模型,越来越多地运用到太阳风速度预测领域。深度学习通过多层神经网络的处理,逐步将一开始的“低层”特征表示转变为后续的“高层”特征表示,模型即可完成复杂的分类、回归等学习任务。然而,目前存在的深度学习方法通常根据历史数据,预测未来某一个时间点的太阳风速。这些属于单步预测方法。与之相对的,在时间序列预测问题中,多步预测是一种广泛运用的方法。多步预测是指在给定历史数据,对未来几个时间步的一些变量进行预测。这种预测方法在一些场景下能够满足连续多步输出的需求。并且,在一组时间步中,可能在某些尺度或分辨率上观察到各种时间序列成分,如复杂趋势、季节性和噪声。此外,多步预测方法可以提高信息利用效率和预测精度。它在输出端集成了数据的连续信息,从而可以基于相邻时间点的预测知识对目标进行预测。因此,对于太阳风速度预测问题,也可以采用多步预测的机制。而根据了解,目前尚未有基于多步预测的太阳风速度预测方法。此外,如何有效地构建多步预测太阳风速度预测模型是一个挑战。对于这个问题,可以引入多任务学习的方法。多任务学习是一种让多个相关的任务进行并行联合学习的机制,它可以利用多个相关任务的信息来充分调节神经网络模型中的参数,从而提升模型的泛化能力。在多任务学习中,多个相关任务在训练时共享特征,每个任务可以通过复用其他任务已学到的有用的知识,加快自身的训练,共同提高模型的预测精度。此外,多任务学习也可以利用不同任务之间的差异来降低模型过拟合的可能性,也进一步提升了模型的泛化能力。
发明内容
针对上述现有技术,本发明提供一种基于多任务深度学习神经网络的太阳风速度预测方法,解决了现有技术中存在的问题。
采用多任务学习机制来实现多步预测,构建模型。在太阳风速度预测领域,引入多任务学习的机制是一种新的尝试。
为了解决上述技术问题,本发明提出的一种基于多任务深度学习神经网络的太阳风速度预测方法,所采用的神经网络模型包括一个共享模块、一个主LSTM模块以及一个自回归层(AR)模块;所述共享模块由一维CNN模块和一个共享LSTM模块组成;所述一维CNN模块用于接收序列输入和自动学习数据空间特征,对不同维度的输入属性的相互关系进行建模;所述共享LSTM模块用于捕获时间序列的时间相关性,并提取不同预测任务之间的相关信息,在多任务并行训练中,通过神经网络的反向传播实现所述共享模块参数的联合学习和共享;所述主LSTM模块用于解码所述共享模块中的多任务共享信息,并单独用于主任务的预测,所述主LSTM模块用于接收所述共享模块的输出;所述主LSTM模块和所述共享LSTM模块的结构相同;所述自回归层(AR)模块用于以一种线性的方式对神经网络模型进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111674519.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提高海洋台站调取速度的方法
- 下一篇:一种土壤修复装置