[发明专利]一种基于探测式深度网络的时空大数据预测方法在审
申请号: | 201711339998.8 | 申请日: | 2017-12-14 |
公开(公告)号: | CN107944550A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 龙明盛;王建民;王韫博;黄向东 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司11002 | 代理人: | 王莹,李相雨 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 探测 深度 网络 时空 数据 预测 方法 | ||
技术领域
本发明涉及计算机数据分析技术领域,尤其涉及一种基于探测式深度网络的时空大数据预测方法。
背景技术
随着传感器网络、手持移动设备等的普遍应用,遥感卫星和地理信息系统等的显著进步,一种同时具有时间和空间维度的数据——时空数据,大量存在于金融、气象、环保、安防等领域。
目前,机器学习已经被成功应用于时序数据分析和时序信号处理领域,而如何准确预测大规模流式到来的高维时空序列数据,则成为了大数据背景下亟待解决的科学问题。
单纯使用序列到序列(Seq2Seq)方法来预测时空序列,得到的预测结果通常只明显依赖于前方有限个时间点的输入,难以利用之前更远的时间点输入的数据的特征。而这些序列到序列模型容易遗忘的特征,往往与当前的预测结果紧密相关。这导致用于预测较长时间序列的卷积长短时间记忆单元(Convolutional LSTM)网络难以被训练。单纯的序列到序列模型,对于时间跨度较大的序列,难以有效的学习序列中的运动模式,造成预测不准确。
此外,由于时空数据序列具有输入数据预期待的输出数据分布相同的特点,而通用方法是对于解码器的每一帧输入都是上一时间节点的输出,不可避免地会受到误差累计的影响。
发明内容
本发明为解决现有技术中存在的问题,提供了一种基于探测式深度网络的时空大数据预测方法。
一方面,本发明提出一种时空数据预测方法,包括:将时空序列输入训练好的探测式卷积递归神经网络模型,获取预测结果;其中,所述探测式卷积递归神经网络模型由编码器、预测器和探测器构成,所述编码器、预测器和探测器分别由若干个卷积长短时间记忆单元构成,所述探测式卷积递归神经网络模型的训练方法包括:S1,将时空序列的前K个时刻的空间数据输入编码器,获取K+1时刻的空间数据预测值;将所述K+1时刻的空间数据预测值输入预测器,获取K+2至K+J时刻的空间数据预测值;将所述时空序列的K+1至K+J-1时刻的空间数据输入探测器,获取K+2至K+J时刻的空间数据探测值;S2,根据所述空间数据预测值、空间数据探测值和时空序列,应用损失函数计算所述预测器和探测器的输出值与时空序列的差距;S3,对所述模型进行优化并重复步骤S1和S2,直至所述差距满足预设条件,获取所述训练好的探测式卷积递归神经网络模型。
优选地,所述编码器由K组预测单元构成,所述预测器和探测器分别由J-1组预测单元构成,任一所述预测单元由若干层所述记忆单元构成;任一所述记忆单元接收前一组预测单元中同一层记忆单元的记忆,并向后一组预测单元中同一层记忆单元发送所述任一记忆单元的记忆;任一所述记忆单元的输入为同一组预测单元中的前一层记忆单元的输出。
优选地,所述编码器的第K组预测单元中的记忆单元分别向所述预测器和探测器的第一组预测单元中同一层记忆单元发送记忆;所述预测器和探测器的第一组预测单元中的记忆单元接收所述编码器的第K组预测单元中同一层记忆单元发送的记忆;所述编码器的第m组预测单元中的底层记忆单元的输入为所述时空序列中的m时刻的空间数据;m=1,2,…,K;所述探测器的第n组预测单元中的底层记忆单元的输入为所述时空序列中的K+n时刻的空间数据;n=1,2,…,J-1;所述探测器第n组预测单元的顶层记忆单元的输出为K+n+1时刻的空间数据探测值;所述预测器的第p组预测单元的底层记忆单元的输入为K+p时刻的空间数据预测值;p=1,2,…,J-1;所述预测器第p组预测单元中的顶层记忆单元的输出为K+p+1时刻的空间数据预测值。
优选地,所述步骤S1中的所述模型的目标是估计条件概率其中,(χ1,…,χK)为所述时空序列中1至K时刻的空间数据,即S1中编码器的输入序列,为所述预测器输出的预测时空序列,所述预测时空序列包括K+1至K+J时刻的空间数据预测值;首先,编码器将输入序列(χ1,…,χK)的信息压缩为固定维度的特征表示,保存在编码器最后一个记忆单元的隐藏状态中;然后,预测器根据所述特征表示计算输出序列的条件概率:
其中,为所述预测时空序列中K+1至K+J时刻的空间数据预测值,fencoder(X1,…,XK)表示所述编码器最后一个记忆单元的隐藏状态。
所述步骤S1中通过所述预测器获取的K+p时刻的空间数据预测值如下:
式中,fpredictor表示预测器的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711339998.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于人工智能的数据分析方法
- 下一篇:一种用于电润湿显示屏缺陷识别方法