[发明专利]基于非自回归模型的含缺失值车辆轨迹序列填补修复方法在审
申请号: | 202210238130.3 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114595427A | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 马千里;陈楚鑫 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06F17/16;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 黄卫萍 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 回归 模型 缺失 车辆 轨迹 序列 填补 修复 方法 | ||
本发明公开了一种基于非自回归模型的含缺失值车辆轨迹序列填补修复方法,包括以下步骤:获取车辆轨迹序列数据集,对数据集进行归一化处理并将归一化后的数据集划分为训练集与测试集;构建深度神经网络,包括缺失信息衰减模块和非自回归填补网络,并使用训练集对构建好的深度神经网络进行训练以确定深度网络的各项参数;将测试集输入到深度网络中,得到填补后的测试集数据,即含缺失值车辆轨迹数据的填补结果。本发明可为车辆轨迹数据提供一种非自回归的填补框架,解决了传统的基于自回归模型的方法中存在的误差累积问题,同时也能有效地建模车辆轨迹序列的时序信息。
技术领域
本发明涉及车辆轨迹数据研究技术领域,具体涉及一种基于非自回归模型的含缺失值车辆轨迹序列填补修复方法。
背景技术
缺失数据的填补在车辆轨迹序列研究中一直具有重要的实验价值。例如,当获得若干车辆轨迹序列后,对车辆轨迹序列中含有的缺失值进行填补是一种常用的实验手法,填补方法能够按照数据的分布情况为数据中的缺失位置填补合理的预测值,为进一步的数据挖掘提供极大的帮助。
在车辆轨迹序列的填补过程中,常用的基于自回归模型的填补算法或模型存在不可避免的误差累积问题。这种误差累积问题无关于填补算法的好坏而普遍存在。这导致填补误差随着填补过程的进行而不断累积,造成填补值不断偏移。
在一般类型数据的填补过程中,算法从数据的整体分布信息建模,忽略时序尺度上的可利用信息。因此,尽管这部分填补方法不受误差累积问题影响,但由于其对时序信息利用不充分的特性,这部分填补方法不适合填补序列型数据,如车辆轨迹序列数据。
综上,目前亟待解决车辆轨迹序列填补中的误差累积问题,并有效地建模含缺失值车辆轨迹序列的时间信息,从而提升车辆轨迹序列数据的填补质量。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于非自回归模型的含缺失值车辆轨迹序列填补修复方法。本发明将填补过程视作是一个端到端的整体来进行,不需要迭代地进行填补,从而避免了误差累积问题。同时,本发明针对含缺失值车辆轨迹序列的特点,设计了相应的模块用于有效地捕获含缺失值车辆轨迹序列的时间信息。
本发明的目的可以通过采取如下技术方案达到:
一种基于非自回归模型的含缺失值车辆轨迹序列填补修复方法,包括以下步骤:
S1、获取车辆轨迹序列数据集,所述车辆轨迹序列数据集为一个数据矩阵X,数据矩阵X由N个行向量组成,N表示数据矩阵X中记录的车辆轨迹个数,每一个行向量Xi对应车辆的轨迹序列,Xi表示数据矩阵X中的第i个行向量,即第i条车辆轨迹序列样本,i=1,2,…,N,每一个行向量Xi的长度为T;
S2、构建基于非自回归模型的含缺失值车辆轨迹序列填补修复的深度神经网络模型,所述深度神经网络模型包括顺序连接的缺失信息衰减模块和非自回归填补网络,其中,缺失信息衰减模块接收车辆轨迹序列数据集样本作为输入,并输出车辆轨迹序列数据集样本的隐层表示;非自回归填补网络包括层叠的自注意力模块和线性解码模块;其中,层叠的自注意力模块接收所述缺失信息衰减模块输出的隐层表示作为输入,并输出隐层表示的深层编码;线性解码模块接收层叠的自注意力模块输出的深层编码作为输入,并输出车辆轨迹序列数据集样本的填补结果;通过车辆轨迹序列数据集中样本对所述深度神经网络模型进行训练,并确定所述深度神经网络模型的可学习参数;
S3、将所述车辆轨迹序列数据集中真实样本输入到经过训练的深度神经网络模型中,获得所述车辆轨迹序列数据集中真实样本的填补结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210238130.3/2.html,转载请声明来源钻瓜专利网。