[发明专利]一种交通数据弥补方法有效

申请号：	201410336212.7	申请日：	2014-07-15
公开（公告）号：	CN104091081B	公开（公告）日：	2017-04-19
发明（设计）人：	王飞跃;段艳杰;吕宜生;亢文文;朱凤华;刘裕良;赵一飞	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G06F19/00	分类号：	G06F19/00;G06F17/30
代理公司：	中科专利商标代理有限责任公司11021	代理人：	宋焰琴
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种交通数据弥补方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于智能交通系统领域，特别涉及一种基于降噪堆式自动编码器(Denoising Stacked Autoencoders)深层网络结构的交通数据弥补方法。

背景技术

交通数据是交通领域应用和研究的基础。个体出行者的出行规划、研究者和政府部门的交通控制与管理均需要足够的交通数据作为支持。然而，采集自实际交通系统中的交通数据往往是不完整的数据，含有部分缺失数据。这些缺失数据的存在为交通分析和研究带来诸多不便。交通数据弥补旨在尽可能准确地填补这些缺失的数据，为交通领域的应用和研究提供足够的数据支持。

现有的交通数据弥补方法主要有基于时间序列分析的方法，非参数回归方法和统计学习估计方法。基于时间序列分析的方法通常使用待弥补位置的历史交通数据建立一个预测模型并预测缺失位置的数据。非参数回归方法通常使用临近位置或者临近状态的数据来估计缺失位置的数据。统计学习估计方法通常使用观测数据学习一个模型并通过迭代的模式推测缺失的数据。上述这些方法在不同的应用场景中均表现出一定的应用价值。但是这些方法的弥补误差通常会随着数据缺失率的提高而增大。而且这些方法将观测数据和缺失数据分开对待，不能充分挖掘交通数据之间的结构关联。对于数据量较大的交通数据，这些方法的弥补效率不高。

发明内容

(一)要解决的技术问题

本发明的目的是解决现有技术对于数据量较大的交通数据，弥补效率低的问题，提出一种基于降噪堆式自动编码器的深层网络结构的交通数据弥补方法。

(二)本发明的技术方案

本发明的一种交通数据弥补方法，包括以下步骤：

步骤S1：按照设定的交通数据缺失率对完整交通数据集进行随机缺失处理，获得缺失处理后的完整交通数据集；

步骤S2：对缺失处理后的完整交通数据集和完整交通数据集进行归一化处理，得到归一化后的交通数据；

步骤S3：对基于降噪堆式自动编码器深层网络结构的交通数据弥补模型进行训练，构建出弥补模型；

步骤S4：调用弥补模型对输入的含缺失数据的不完整的交通数据进行弥补，得到弥补后的交通数据值。

(三)本发明的有益效果

现有技术中目前还没有基于降噪堆式自动编码器的深层网络结构的交通数据弥补方法，本发明考虑深度挖掘交通数据之间的结构关联，高效率地弥补交通数据的方法，研究基于深层结构模型的交通数据弥补问题。本发明包括数据处理，深层网络训练，利用深层网络进行交通数据弥补。利用完整的交通数据，通过训练基于降噪堆式自动编码器的深层网络结构，得到一个深层结构的网络弥补模型进行交通数据弥补。本发明将缺失数据和观测数据视为整体，以数据恢复的角度弥补交通数据，深度挖掘交通数据之间的结构关联，能够一次补全缺失的交通数据，在不同的数据缺失率下保持稳定的弥补误差，弥补效率高，鲁棒性好。

附图说明

图1是本发明交通数据弥补方法流程图。

图2是本发明获取交通数据弥补模型流程图。

图3是降噪自动编码器结构示意图。

图4是堆式自动编码器结构示意图。

图5是本发明深层网络交通数据弥补模型结构图。

具体实施方式

下面将结合附图对本发明加以详细说明，应指出的是，所描述的实施例仅旨在便于对本发明的理解，而对其不起任何限定作用。

如图1所示，本发明给出一种交通数据弥补方法，具体地，该方法包括以下步骤：

步骤S1：按照设定的交通数据缺失率对完整交通数据集进行随机缺失处理，获得缺失处理后的完整交通数据集；

所述完整的交通数据集来源于交通数据采集系统，可以通过线圈检测、视频检测等手段获取。获取的交通数据为每个观测点在一定时间间隔内的属性，例如流量，平均速度，平均占有率等。以下描述以交通数据中的流量为例说明。

所述设定的交通数据缺失率是待弥补交通数据的缺失率。