[发明专利]基于辅助监督学习的行程时间估计方法有效
申请号: | 201810658375.5 | 申请日: | 2018-06-25 |
公开(公告)号: | CN109035761B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 孙未未;章瀚元;吴昊 | 申请(专利权)人: | 复旦大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06N3/04 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于智能交通技术领域,具体为一种基于辅助监督学习的行程时间估计方法。其从海量历史轨迹数据中寻找统计规律,通过端到端的深度学习模型对整个行程的时间进行整体的估计;步骤包括:特征提取和表示阶段,对轨迹数据进行预处理,分别抽取它的时间和空间特征,驾驶状态特征,短时间和长时间的交通状况特征;训练和预测阶段,将这些提取的特征用统一的双向循环神经网络进行训练和预测;循环神经网络每一步都输出通过当前小区域的时间开销;这些小区域的时间开销的总和即为总路径的时间开销。同时,还引入双向区间损失函数来约束中间时间开销。本方法可高效准确地对城市中的车辆行程时间进行估计,在实际环境下具有较好的效果。 | ||
搜索关键词: | 基于 辅助 监督 学习 行程 时间 估计 方法 | ||
【主权项】:
1.一种基于辅助监督学习的行程时间估计方法,其特征在于,分为三个阶段:(一)特征提取和表示阶段,对历史轨迹数据进行预处理,抽取它的各方面特征;(二)训练阶段,将历史轨迹数据中提取的特征输入到一个统一的双向循环神经网络进行训练,并且以双向区间损失函数作为训练的约束;(三)预测阶段,用双向循环神经网络对查询路径中提取的特征进行推断并估计行程时间;(一)特征提取和表示阶段的具体步骤为:步骤(1),在城市范围内,根据经纬度坐标对网格进行细粒度划分,形成一个个相邻的矩形小区域;将由按时间顺序排序的历史GPS坐标组成的轨迹序列中的每一个坐标点映射到对应的小区域中,形成一个由网格坐标组成的序列;步骤(2),对于每一个网格,挖掘它不同方面的特征;首先,利用嵌入向量技术来表征每一个网格小区域在不同空间以及不同时间段的语义信息;这些信息包含城市不同的功能区域空间区位信息,也包括早高峰,周末等时间信息;具体地,利用低维向量来表示每一个网格的空间向量Vsp,将一天划分成多个时间桶,每一条轨迹根据具体落入的时间桶来得到时间向量Vtp;对Vsp和Vtp进行随机初始化,之后在模型训练时跟着模型一起训练;步骤(3),使用四维向量Vdri来表示当前行驶阶段是出发阶段,中途阶段,还是结束阶段,以及在各个阶段已经行驶的比例;步骤(4),定义短时间交通状况特征为Vshort,定义长时间交通状况特征为Vlong,具体地,定义:
表示在过去第j个时间区间内,当前小区域gi的交通状况,其中vj表示历史平均速度,nj表示历史轨迹数据数量,leni/vj表示粗略估计的通过时间;将这些交通状况特征按照历史时间顺序输入到一个子循环神经网络中,用以抽取出交通状况特征;另外,考虑邻接小区域的交通状况信息,即定义:
表示距离gi距离不超过d的网格集合,收集它们过去短时的交通状况特征,一起输入到神经网络中;其中,x,y表示网格的坐标,gj表示除gi以外的其他网格;(二)训练阶段的具体步骤为:步骤(1),构建循环神经网络;定义网络隐层为
输入数据为
那么,第t步的输入数据为xt,第t步得到的计算结果为ht,则有:ht=φ(xt·Wx+ht‑1·Wh+b) (3)其中,
是输入数据的权重矩阵(weight matrix),
是隐层的权重矩阵,
是偏置参数(bias);即隐状态表示为函数:ht=f(ht‑1,xt) (4)在这基础上,定义遗忘门为:ft=σ(Wf·[ht‑1,xt]+bf) (5)输入门为:it=σ(Wi·[ht‑1,xt]+bi) (6)输出门为:ot=σ(Wo[ht‑1,xt]+bo) (7)记忆单元的更新为:![]()
隐层的更新为:ht=Ot·tanh(Ct) (10)其中,Wf,Wi,Wo,
分别表示遗忘门,输入门,输出门和记忆单元的权重矩阵,bf,bi,bo,
则是对应的偏置参数;σ()为一个非线性的激活函数;f( )表示一个包含各层参数的抽象神经网络函数,定义循环神经网络对应的参数为WN,从[‑α,α]的均匀分布中对每个元素进行初始化,其中,α是为一个超参数,设定范围为0.01到1;双向循环神经网络同时使用正向的循环神经网络和反向的循环神经网络进行计算;其中正向循环神经网络根据序列的顺序依次将之前步骤提取的网格特征输入,反向循环神经网络则将序列逆序后输入网格特征;定义它的隐变量为正向和反向网络的拼接,即:
步骤(2),将历史轨迹数据中提取的特征,即空间特征Vsp,时间特征Vsp,驾驶状态特征Vdri,历史上短时间和长时间的交通状态特征Vshort和Vlong,拼接成一个统一的特征向量:V=(Vsp,Vsp,Vdri,Vshort,Vlong) (11)在每一个经过的小网格输入到双向循环神经网络,以得到经过该网格的通过时间,即WT·hi+b,总的行程的时间开销
为:![]()
为计算总时间开销的权重矩阵和偏置参数,WT表示W矩阵的转置;步骤(3),定义轨迹经过各个网格序列的真实时间开销向量为T;顺序的真实时间开销向量为Tf,逆序的真实时间开销向量为Tb;则神经网络估计得到的时间开销向量为:![]()
使用双向区间损失函数对模型进行辅助监督学习,使其不仅学习整条路径的时间开销,同时可以学习各个中间阶段的通行时间;定义双向区间损失函数为:
其中,M表示轨迹是否经过小区域的掩码,[]表示向量每个元素间的操作;步骤(4),训练的目标是最小化损失函数L,即:
其中,θ表示模型的训练参数,ε表示时间和空间上的嵌入向量,S是训练集的大小;最后,使用基于时间顺序的反向传播算法对模型进行参数的更新和优化;(三)预测阶段的具体步骤为:步骤(1),给定一条没有时间戳标记的真实行程作为查询路径,根据经过的实际路径,得到其映射的网格序列;对于每一个经过的小网格,使用特征提取和表示阶段抽取得到的时空特征Vsp和Vtp,驾驶状态特征Vdri,和历史上短时间和长时间的交通状态特征Vshort和Vlong,作为该网格的总特征表示V;其中,时空特征的嵌入向量使用经过训练过程的参数更新后的向量信息;短时间和长时间的交通状态特征使用经过训练的子循环神经网络进行特征挖掘;步骤(2),在每一个经过的网格,将抽取的各方面特征输入到已经经过训练的双向循环神经网络中,得到当前的隐变量ht,那么经过当前区域的估计时间为WT·ht+b,而总的时间开销估计值为:
其中,n表示经过的总网格数目,
为经过训练得到的,计算总时间开销的权重矩阵和偏置参数,WT表示W矩阵的转置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810658375.5/,转载请声明来源钻瓜专利网。